Санскар Гупта и Сукант Хурана

Наука о данных и искусственный интеллект меняют не только социальные сети, анализ фондового рынка, телекоммуникационную отрасль, здравоохранение, транспорт и т. Д., Но даже расширяют наше понимание Вселенной, помогая исследованиям физики элементарных частиц. Давайте проведем вас через недавний эксперимент, чтобы выделить это, и кратко поговорим о том, что некоторые специалисты по данным надеются сделать с наукой о данных и искусственным интеллектом в этом направлении. Мы не будем говорить о физике, раскрытой в ходе этих экспериментов, а будем говорить только о целях эксперимента просто потому, что мы все еще делаем маленькие шаги к тому, чтобы стать физиками, поэтому мы будем говорить о том, что мы хорошо знаем, а именно об искусственном интеллекте. Мы разместили ссылки, по которым вы можете лично проверить физику. Мы надеемся, что однажды мы сможем узнать о физике столько же, сколько об искусственном интеллекте; может быть, этот день настанет и с футуристическими мозговыми имплантатами, или с действительно долгой жизнью, или с резким упорством. Нам не терпится взять в руки и эти проблемы. Здесь мы просто обсуждаем два противоположных подхода в искусственном интеллекте, которые использовались для выхода на новый рубеж науки о данных и искусственного интеллекта.

Недавно был организован конкурс машинного обучения с бозоном Хиггса, который способствовал сотрудничеству между физиками высоких энергий и специалистами по обработке данных. Соревнование проводилось на сайте kaggle, и в нем приняло участие большое количество участников.



Бозон Хиггса, известный как божественная частица, был открыт несколько лет назад, и с этого момента ученые упорно трудятся, чтобы найти фиксированное место для бозона Хиггса в стандартной модели в зависимости от его характеристик и природы. ATLAS - это эксперимент по физике элементарных частиц в ЦЕРНе, в котором протоны разбиваются при высоких энергиях и анализируются данные после столкновения. Когда бозон Хиггса распадается, образуются две тау-частицы, поэтому, зная присутствие тау-частиц, можно подтвердить присутствие бозона Хиггса, но энергия тау-частиц мала, и часто в ней преобладает фоновый шум.

Для работы над этой интересной проблемой выстроились несколько инженеров. Некоторые участники Kaggle использовали глубокие нейронные сети. Тем не менее, некоторые использовали ансамблические подходы. Итак, какой подход победил в данном случае?



Хотя вы все, вероятно, знаете о глубоких нейронных сетях и глубоком обучении (если вы не читали ссылку на вики, вставленную выше), но, возможно, вы не слышали об ансамбле, поэтому давайте поговорим об этом немного. Он включает агрегирование изученных моделей для повышения точности. Метод ансамбля можно сделать аналогом феномена мудрости толпы. Например, в шоу «Кто хочет стать миллионером» линия жизни, включающая опрос аудитории, является наиболее точной.



Сборка моделей обычно осуществляется 3 способами:

  1. Комитет: используется невзвешенное среднее значение моделей.
  2. Средневзвешенные значения: здесь участвуют веса, т.е. лучшим предикторам присваивается больший вес.
  3. Третий способ предполагает использование прогнозов различных более слабых моделей в качестве характеристик для обучения общей окончательной модели.

Метод ансамбля аналогичен многослойному персептрону, где каждый слой создает набор функций для следующего слоя, за исключением того различия, что в многослойном персептроне все слои обучаются одновременно, тогда как при ансамбле обучение моделей выполняется один за другим, и они объединяются. для постобработки.

Некоторые из преимуществ использования учащихся в ансамбле - это меньшее количество ошибок и меньшая подгонка.

Какой подход победил?

Глубокая нейронная сеть оказалась наиболее точной, и в результате она выиграла испытание. DNN Показала способность экстраполировать новые функции из ограниченного набора функций, содержащихся в обучающем наборе. Он искал и находил другие функции, которые коррелируют с уже известными. Он обнаружил способность глубокого обучения создавать функции без явного указания. Это снизило потребность в разработке функций, одной из самых трудоемких частей практики машинного обучения.

Хотя в этом случае DNN был явным победителем, нужно помнить, что DNN - это не панация. Некоторые из общих недостатков DNN:

Он может превзойти другие алгоритмы машинного обучения, только если имеется большой объем данных.

Его обучение требует больших вычислительных ресурсов, поэтому требует значительных вычислительных мощностей, в результате чего увеличивается стоимость оборудования.

То, что изучается, понять непросто. Другие классификаторы (например, деревья решений, логистическая регрессия и т. Д.) Значительно упрощают понимание происходящего.

Вы можете спросить, а что, если бы ансамбль содержал компонент глубокого обучения; Что ж, вам придется попробовать это или подождать, пока кто-нибудь из лаборатории Хурана попробует это. Мы надеемся, что на этом небольшом примере мы покажем, как ИИ проникает во все отрасли знания. По мере того, как мы пытаемся это сделать, мы не только смешиваем несколько подходов искусственного интеллекта и разрабатываем новые подходы (вам придется подождать), но и надеемся использовать нашу работу по анализу шума и для решения этой проблемы. Не позволяйте этому последнему утверждению просто проскочить как саморекламу, подумайте глубже. Мы считаем, что подход к анализу шума, который включает детерминированные подходы, будет работать синхронно с глубоким обучением и ансамблевыми подходами к решению проблем будущего.

— — — — — — — — — — — — — — — — — — — — — -

О:

Санскар Гупта - исследователь, работающий с доктором Хураной над применением ИИ в физике элементарных частиц.

Доктор Сукант Хурана руководит академической исследовательской лабораторией и несколькими технологическими компаниями. Он также известный художник, автор и оратор. Вы можете узнать больше о Sukant на www.brainnart.com или www.dataisnotjustdata.com, а если вы хотите работать над проектами в области биомедицинских исследований, нейробиологии, устойчивого развития, искусственного интеллекта или науки о данных для общественного блага, вы можете связаться с его на [email protected] или связавшись с ним по linkedin https://www.linkedin.com/in/sukant-khurana-755a2343/.

Вот два небольших документальных фильма о Суканте и видео на TEDx о его усилиях в области гражданской науки.



Эта история опубликована в The Startup, крупнейшем предпринимательском издании Medium, за которым следят более 287 184 человека.

Подпишитесь, чтобы получать наши главные новости здесь.