Мысли о границе эффективности для анализа.
Проблема эффективного объединения данных и математических моделей с реальными приложениями существует уже несколько десятилетий. Огромные достижения в вычислительной мощности и математическом моделировании имеют меньшую ценность при отсутствии решения.
Я рассматриваю неспособность быстро сопоставить модели с правильными данными и приложениями как основное препятствие для области науки о данных. Недавний опрос дает болезненные доказательства отсутствия практических приложений искусственного интеллекта (ИИ), подмножества всех моделей. Самыми большими препятствиями являются лидеры, которые не ценят его ценность, и трудности с поиском бизнес-проблем в этих фирмах, для которых ИИ может быть полезен.[1]»»
Количество практических А.И. приложения значение намного ниже, чем инвесторы, через рыночную капитализацию для стартапов, считают справедливым. Истинный путь лежит в продвижении процесса моделирования к границе эффективности. Таким образом, приложения рационального моделирования будут процветать. Ажиотажа будет меньше, а успеха больше. Слияние моделей и данных с использованием сетей — это направление.
Еще одна проблема связана с ростом объема данных. Это впервые возникло во время бума .com. На Smart World 2004 Сунил Гупта из SAP перефразировал Сэмюэля Тейлора Кольриджа, сказав: данные, данные везде, но ни байта для использования.[2]» на 40–60 % для многих организаций. [3] Только в 2004 г. поставки устройств для хранения данных в четыре раза превышали объем, необходимый для хранения каждого когда-либо произнесенного слова. на протяжении всей истории человечества.[4]
Около 2015 года началась Четвертая промышленная революция. Следовательно, потребность в интеграции данных и моделей станет еще более важной. Однако, несмотря на достижения в области искусственного интеллекта, машинного обучения (МО) и других технологий, общий рост факторной производительности в США с 2005 года оставался статичным[5]. как электричество, транспорт, массовое производство и вычисления.
Некоторые утверждают, что бум еще не наступил. [6] Существуют доказательства на этот счет. [7] Однако определенность будущего вызывает большие сомнения.
Предпосылка заключается в том, что большие наборы данных из стационарных процессов будут содержать полезные шаблоны, помогающие принимать решения по всем направлениям. Кроме того, весь бизнес получает выгоду от универсальной технологии ИИ. и мл. Эти шаблоны, если они существуют, невозможно идентифицировать без моделирования. Это основная философия.
Недостатком является необходимость доступа к огромным объемам данных. Только компании из списка Fortune 500 достаточно велики, чтобы иметь достаточный доступ к данным. Точно так же, если происходит изменение, должны быть новые данные. Это может занять много времени, чтобы получить. Если новых данных не существует, принимаются неверные решения. Например,
Это трудно предсказать и делает финансовую отдачу гораздо менее гарантированной.
Чтобы указать широкой аудитории на то, что многие давно знают в модельном сообществе, требуется мужество. Особенно это касается А.И. и мл. Точная оценка такова:
— Гэри Маркус, Нью-Йоркский университет
То же самое верно для любого обучения.
Усугубляет ситуацию то, что существует большое количество неструктурированных данных, которые чрезвычайно сложно организовать с использованием современных компьютерных подходов. К неструктурированным данным относятся изображения, текст, сообщения электронной почты и инженерные проекты. Во всех этих случаях для представления объекта требуется больше, чем серийный номер, хранящийся в базе данных, или URL-адрес. Только при использовании слов машинопонятным способом описания этих объектов могут стать полезными для поисковых, организационных и аналитических целей.
Работа с растущими объемами структурированных и неструктурированных данных потребует новых стандартов и информационных архитектур. Интеграция и связь между оборудованием, программным обеспечением и бизнес-объектами должны быть улучшены. Это становится важным, поскольку компании стремятся преодолеть барьеры, которые ограничивают беспрепятственную передачу данных, как внутренних, так и внешних по отношению к фирме.
Всегда важно помнить об основах. Это обеспечивает прочную основу для любой инженерной дисциплины.
Математические модели — это простые представления, включающие характеристики реального мира, которые считаются важными.[10] Модели подчеркивают имеющиеся факты и интересы. Они изображают лишь часть реальности. Некоторые доходят до того, что говорят, что мыслительный процесс человека представляет собой специализированную модель реального мира. [11]
Математические модели особенно полезны для понимания сложных ситуаций. Помимо выявления важных проблем и помощи в общении, модели представляют наибольшую ценность, предлагая объяснения наблюдаемым событиям.
Хотя математические модели чрезвычайно полезны для понимания, процессу построения моделей часто не хватает производительности, поскольку разработка редко идет по линейному пути [12] [13], а менеджерам требуются отдельные естественные, математические и компьютерные представления. , строители моделей и компьютерные программисты. [14] Это увеличивает потребность в подробном интерфейсе, который имеет тенденцию препятствовать беспрепятственному совместному использованию моделей в сети. В результате реализация математических моделей является сложной, трудоемкой и требует передовых технических возможностей и инфраструктуры.
Специалисты часто разрабатывают модели внутри бизнес-организаций или научных кругов. Это работа, специфичная для приложения, и одна и та же техника построения модели должна заново изобретаться для каждой новой ситуации. Хотя внутренняя разработка может привести к значительным прорывам, этот подход зависит от проб и ошибок, чтобы найти то, что работает на практике, в сочетании с интуицией и обширным знанием технических публикаций. Основная мотивация создания M Language, который начинался как исследовательский проект в рамках программы MIT Data Center, заключалась в том, чтобы сделать моделирование менее специализированной задачей.
Промышленность нуждается в компьютерном языке для описания и обмена моделями через Интернет, а также для взаимодействия данных, увеличения тактовой частоты [15] моделирования. Это лучшее направление для науки о данных по сравнению с целеустремленной одержимостью искусственным интеллектом. и мл. Как и другие модели, эти подходы эффективны в специализированных приложениях. Но они страдают от потребности в значительных объемах данных. Стабильные модели не обязательно существуют. Если что-то изменится, все предыдущие данные станут бесполезными.
ИСПОЛЬЗОВАННАЯ ЛИТЕРАТУРА
[1] Мимс, К., 2020 г. ИИ — это не волшебство, и он не поможет вам снова открыть свой бизнес. The Wall Street Journal, 20 мая.
[2] Гупта, С., 2004 г., Расширение возможностей цепочки спроса, ориентированной на потребителя, с помощью глобальной синхронизации данных, Smart World 2004 — семантическое моделирование: Кембридж, Массачусетс, 8 декабря.
[3] Парк, А., 2004 г., Может ли emc добиться роста за пределами аппаратного обеспечения? BusinessWeek, 1 ноября.
[4] Лайонс, Д., 2004 г., Слишком много данных, Forbes, 13 декабря.
[5] Гордон, Р. Дж., 2017. Взлет и падение американского роста: уровень жизни в США после гражданской войны (Принстонская экономическая история западного мира) (стр. 628). Издательство Принстонского университета. Киндл издание.
[6] Бриньолфссон, Э. и А. Макафи, 2011. Гонка против машины. Цифровая пограничная пресса.
[7] Бриньолфссон, Э., Д. Рок и К. Сайверсон, 2018. Кривая производительности j: как нематериальные активы дополняют технологии общего назначения. Серия рабочих документов NBER (25 148).
[8] Там же, исх. 1.
[9] Там же, исх. 1.
[10] Приписывается профессору Грегору М. Рейнхарду из Университета Гэннона, GH-501 Public Policy Process, преподавал в 1984 году.
[11] Forrester, JW, 1961. Industrial Dynamics, Waltham, MA: Pegasus Communications.
[12] Willemain, T.R., 1994. Взгляд на моделирование от дюжины экспертов. Исследование операций 42: 2, стр. 213–222.
[13] Willemain, T.R., 1995. Формулировка модели: что и когда думают эксперты. Исследование операций 43: 6, стр. 916–932.
[14] Джеффрион, А.М., 1987. Введение в структурное моделирование. Наука управления 33: 5, стр. 547–588.
[15] Fine, C.H. (1998), Тактовая частота. Рединг, Массачусетс: Книги Персея.