Объединение модели и данных

Мысли о границе эффективности для анализа.

Проблема эффективного объединения данных и математических моделей с реальными приложениями существует уже несколько десятилетий. Огромные достижения в вычислительной мощности и математическом моделировании имеют меньшую ценность при отсутствии решения.

Я рассматриваю неспособность быстро сопоставить модели с правильными данными и приложениями как основное препятствие для области науки о данных. Недавний опрос дает болезненные доказательства отсутствия практических приложений искусственного интеллекта (ИИ), подмножества всех моделей. Самыми большими препятствиями являются лидеры, которые не ценят его ценность, и трудности с поиском бизнес-проблем в этих фирмах, для которых ИИ может быть полезен.[1]»»

Количество практических А.И. приложения значение намного ниже, чем инвесторы, через рыночную капитализацию для стартапов, считают справедливым. Истинный путь лежит в продвижении процесса моделирования к границе эффективности. Таким образом, приложения рационального моделирования будут процветать. Ажиотажа будет меньше, а успеха больше. Слияние моделей и данных с использованием сетей — это направление.

Еще одна проблема связана с ростом объема данных. Это впервые возникло во время бума .com. На Smart World 2004 Сунил Гупта из SAP перефразировал Сэмюэля Тейлора Кольриджа, сказав: данные, данные везде, но ни байта для использования.[2]» на 40–60 % для многих организаций. [3] Только в 2004 г. поставки устройств для хранения данных в четыре раза превышали объем, необходимый для хранения каждого когда-либо произнесенного слова. на протяжении всей истории человечества.[4]

Около 2015 года началась Четвертая промышленная революция. Следовательно, потребность в интеграции данных и моделей станет еще более важной. Однако, несмотря на достижения в области искусственного интеллекта, машинного обучения (МО) и других технологий, общий рост факторной производительности в США с 2005 года оставался статичным[5]. как электричество, транспорт, массовое производство и вычисления.

Некоторые утверждают, что бум еще не наступил. [6] Существуют доказательства на этот счет. [7] Однако определенность будущего вызывает большие сомнения.

Предпосылка заключается в том, что большие наборы данных из стационарных процессов будут содержать полезные шаблоны, помогающие принимать решения по всем направлениям. Кроме того, весь бизнес получает выгоду от универсальной технологии ИИ. и мл. Эти шаблоны, если они существуют, невозможно идентифицировать без моделирования. Это основная философия.

Недостатком является необходимость доступа к огромным объемам данных. Только компании из списка Fortune 500 достаточно велики, чтобы иметь достаточный доступ к данным. Точно так же, если происходит изменение, должны быть новые данные. Это может занять много времени, чтобы получить. Если новых данных не существует, принимаются неверные решения. Например,

Многие предпандемические модели для многих бизнес-функций больше не приносят пользы; некоторые могут даже указать бизнесу неверное направление.«[8]»

Это трудно предсказать и делает финансовую отдачу гораздо менее гарантированной.

Чтобы указать широкой аудитории на то, что многие давно знают в модельном сообществе, требуется мужество. Особенно это касается А.И. и мл. Точная оценка такова:

Лучшие алгоритмы остаются врасплох, когда данные, на которых они обучаются, больше не представляют мир, в котором мы живем.«[9]»

— Гэри Маркус, Нью-Йоркский университет

То же самое верно для любого обучения.

Усугубляет ситуацию то, что существует большое количество неструктурированных данных, которые чрезвычайно сложно организовать с использованием современных компьютерных подходов. К неструктурированным данным относятся изображения, текст, сообщения электронной почты и инженерные проекты. Во всех этих случаях для представления объекта требуется больше, чем серийный номер, хранящийся в базе данных, или URL-адрес. Только при использовании слов машинопонятным способом описания этих объектов могут стать полезными для поисковых, организационных и аналитических целей.

Работа с растущими объемами структурированных и неструктурированных данных потребует новых стандартов и информационных архитектур. Интеграция и связь между оборудованием, программным обеспечением и бизнес-объектами должны быть улучшены. Это становится важным, поскольку компании стремятся преодолеть барьеры, которые ограничивают беспрепятственную передачу данных, как внутренних, так и внешних по отношению к фирме.

Всегда важно помнить об основах. Это обеспечивает прочную основу для любой инженерной дисциплины.

Математические модели — это простые представления, включающие характеристики реального мира, которые считаются важными.[10] Модели подчеркивают имеющиеся факты и интересы. Они изображают лишь часть реальности. Некоторые доходят до того, что говорят, что мыслительный процесс человека представляет собой специализированную модель реального мира. [11]

Математические модели особенно полезны для понимания сложных ситуаций. Помимо выявления важных проблем и помощи в общении, модели представляют наибольшую ценность, предлагая объяснения наблюдаемым событиям.

Хотя математические модели чрезвычайно полезны для понимания, процессу построения моделей часто не хватает производительности, поскольку разработка редко идет по линейному пути [12] [13], а менеджерам требуются отдельные естественные, математические и компьютерные представления. , строители моделей и компьютерные программисты. [14] Это увеличивает потребность в подробном интерфейсе, который имеет тенденцию препятствовать беспрепятственному совместному использованию моделей в сети. В результате реализация математических моделей является сложной, трудоемкой и требует передовых технических возможностей и инфраструктуры.

Специалисты часто разрабатывают модели внутри бизнес-организаций или научных кругов. Это работа, специфичная для приложения, и одна и та же техника построения модели должна заново изобретаться для каждой новой ситуации. Хотя внутренняя разработка может привести к значительным прорывам, этот подход зависит от проб и ошибок, чтобы найти то, что работает на практике, в сочетании с интуицией и обширным знанием технических публикаций. Основная мотивация создания M Language, который начинался как исследовательский проект в рамках программы MIT Data Center, заключалась в том, чтобы сделать моделирование менее специализированной задачей.

Промышленность нуждается в компьютерном языке для описания и обмена моделями через Интернет, а также для взаимодействия данных, увеличения тактовой частоты [15] моделирования. Это лучшее направление для науки о данных по сравнению с целеустремленной одержимостью искусственным интеллектом. и мл. Как и другие модели, эти подходы эффективны в специализированных приложениях. Но они страдают от потребности в значительных объемах данных. Стабильные модели не обязательно существуют. Если что-то изменится, все предыдущие данные станут бесполезными.

ИСПОЛЬЗОВАННАЯ ЛИТЕРАТУРА

[1] Мимс, К., 2020 г. ИИ — это не волшебство, и он не поможет вам снова открыть свой бизнес. The Wall Street Journal, 20 мая.

[2] Гупта, С., 2004 г., Расширение возможностей цепочки спроса, ориентированной на потребителя, с помощью глобальной синхронизации данных, Smart World 2004 — семантическое моделирование: Кембридж, Массачусетс, 8 декабря.

[3] Парк, А., 2004 г., Может ли emc добиться роста за пределами аппаратного обеспечения? BusinessWeek, 1 ноября.

[4] Лайонс, Д., 2004 г., Слишком много данных, Forbes, 13 декабря.

[5] Гордон, Р. Дж., 2017. Взлет и падение американского роста: уровень жизни в США после гражданской войны (Принстонская экономическая история западного мира) (стр. 628). Издательство Принстонского университета. Киндл издание.

[6] Бриньолфссон, Э. и А. Макафи, 2011. Гонка против машины. Цифровая пограничная пресса.

[7] Бриньолфссон, Э., Д. Рок и К. Сайверсон, 2018. Кривая производительности j: как нематериальные активы дополняют технологии общего назначения. Серия рабочих документов NBER (25 148).

[8] Там же, исх. 1.

[9] Там же, исх. 1.

[10] Приписывается профессору Грегору М. Рейнхарду из Университета Гэннона, GH-501 Public Policy Process, преподавал в 1984 году.

[11] Forrester, JW, 1961. Industrial Dynamics, Waltham, MA: Pegasus Communications.

[12] Willemain, T.R., 1994. Взгляд на моделирование от дюжины экспертов. Исследование операций 42: 2, стр. 213–222.

[13] Willemain, T.R., 1995. Формулировка модели: что и когда думают эксперты. Исследование операций 43: 6, стр. 916–932.

[14] Джеффрион, А.М., 1987. Введение в структурное моделирование. Наука управления 33: 5, стр. 547–588.

[15] Fine, C.H. (1998), Тактовая частота. Рединг, Массачусетс: Книги Персея.

Объединение модели и данных

Мысли о границе эффективности для анализа.

ИСПОЛЬЗОВАННАЯ ЛИТЕРАТУРА

Вопросы по теме