Оглядываясь вокруг, можно увидеть множество примеров, когда научные сообщества снова работают над тем, чтобы понять, как извлечь выгоду из ИИ и машинного обучения. Сегодня ИИ способствует междисциплинарным научным открытиям во многих областях, таких как изменение климата, здравоохранение, космическая наука и материаловедение. Появляется все больше примеров применения ИИ для разработки лекарств.

Возобновление глобального интереса к пониманию того, как ИИ и машинное обучение могут улучшить процесс научных открытий, обретает форму. Одним из наиболее наглядных примеров является проект DeepMind AlphaFold, в котором методы ИИ, используемые междисциплинарной командой, ускорили новые научные открытия. DeepMind разрабатывала 3D-модели белков такими быстрыми темпами и в таком масштабе, что это оказало огромное влияние на решение одной из самых сложных проблем в биологии.

Какие конкретные проблемы заставляют научное сообщество исследовать ИИ сейчас? Некоторые из них;

Проведение научных экспериментов может занять много времени. На подготовку, проведение и оценку результатов экспериментов уходят сотни часов, особенно в тех случаях, когда необходимо исследовать большое количество переменных.

Сложности при обработке больших объемов данных. Объем данных, производимых для научных открытий, огромен, и многие команды еще не полностью развили способность анализировать этот объем данных. Некоторые примеры этого включают астрономию, где телескопические изображения могут фиксировать миллионы звезд, и биологические открытия, когда микроскопы могут фиксировать процессы и детали молекулярного масштаба.

Сложные данные. Помимо объемов данных, научные сообщества часто имеют дело со сложными типами данных. Исследовательским группам может потребоваться зафиксировать многие параметры, такие как цвет, форма, размер, отношения и другие детали, с помощью передовых сенсорных устройств и инструментов.

Отсутствие метаданных. Когда все эти данные собраны, их редко можно использовать из-за невозможности сбора метаданных. Отсутствующие или неполные метаданные обо всех экспериментальных условиях (например, температура, давление, состав образца и ориентация) затрудняют обучение нейронной сети.

Стоимость и время сбора данных. Получение данных с помощью многих лабораторных или передовых инструментов требует больших затрат и времени. Многие инструменты сбора данных являются специализированными и требуют серьезного обучения, настройки и обслуживания.

Вычислительная мощность. Недостаток вычислительной мощности для проведения сложного анализа.

Совместная наука. Еще одной проблемой для научных сообществ является необходимость поддерживать исследовательское сотрудничество.

Почти для всех этих задач существует множество инструментов и технологий, разработанных как сообществом открытого исходного кода, так и поставщиками корпоративных платформ для обработки и анализа данных. Например,

ИИ может улучшить работу мощных научных инструментов, независимо от масштаба объекта — солнечной системы или молекулы. ИИ можно использовать для автоматизации этапов обработки данных, таких как прием, очистка и объединение больших наборов данных. ИИ может преобразовать процесс экспериментирования.ИИ может помочь ученым улучшить стратегии измерения, определяя, какие образцы следует исследовать и какие детали зафиксировать. В нескольких исследовательских проектах применяются генеративные методы искусственного интеллекта и машинного обучения, чтобы помочь уменьшить проблему или пространство для решения. Улучшения в этой области могут помочь распределенным группам ученых совместно работать над данными и проводить эксперименты.

Автоматизация. Последняя возможность, где ИИ может помочь научному процессу, — это автоматизация с использованием робототехники. Одна университетская лаборатория создала робота-лаборанта, который автоматизировал многие рутинные лабораторные задачи. Этот помощник работал даже во время пандемии Covid-19, когда социальное дистанцирование не позволяло лично работать в лаборатории.

В заключение

Это всего лишь несколько примеров того, как научное сообщество может извлечь выгоду из AI/ML. Сообщество специалистов по данным может многое сделать, чтобы облегчить внедрение в этой относительно зарождающейся, но потенциально важной области.