Подражание ученому: к автоматизированному научному открытию

Мысли и теория

Имитация ученого: на пути к автоматизированным научным открытиям

Как создать двигатель научных открытий за 3 простых шага

Введение

В этой статье я покажу, как создать простой автоматизированный механизм научных открытий. Посмотрите демо.

Нынешняя научная практика ограничена нашими когнитивными и социологическими ограничениями. Машины быстрее, эффективнее и надежнее, чем мы. Самое главное, машины свободны от человеческих предубеждений. Интеграция искусственного интеллекта в научный процесс может привести к следующей научной революции.

Но возможна ли вообще автоматизация науки? Как ни слабо это сегодня, многие верят, что это не только возможно, но и в пределах нашей досягаемости. Институт Алана Тьюринга предложил задачу создать двигатель для научных открытий, который будет неотличим от высококлассных ученых-людей. Идея состоит в том, что четкая формулировка миссии с такой целью, как получение Нобелевской премии, — лучший способ ускорить выполнение задачи (Китано, 2021).

Будет ли машина неотличима от ученых-людей высшего уровня — это лишь одна часть головоломки. Знаменитый аргумент китайской комнаты утверждает, что простое использование синтаксических правил для манипулирования символами не приводит к реальному пониманию. Аналогичные опасения высказывались по поводу понимания научного процесса на человеческом уровне (Gigerenzer 2004, Altman 1994). Тем не менее, прохождение представленного варианта теста Тьюринга является необходимым первым шагом.

Указание области исследования

Первоначальное предложение ориентировано на биологические системы. Я утверждаю, что не биологические, а социальные системы менее всего поддаются автоматизации. Они представляют собой наиболее сложную, эпистемологически запутанную область для изучения. Поскольку социальные системы слишком сложны, чтобы люди могли рассуждать о них, автоматический поиск в огромном пространстве эмпирических гипотез является решающим шагом вперед. Решение этой проблемы для социальных наук послужило бы веским аргументом в пользу автоматизации в других дисциплинах.

Еще одна причина сосредоточиться на социальных системах — уровень зрелости, продемонстрированный исследователями социальных наук. Значение социальных исследований неизмеримо. Это подталкивает социологов к тому, чтобы быть на грани надежности, честности и прозрачности (Камерер и др., 2018, Открытое научное сотрудничество, 2015, Чанг и Ли, 2015). Соответствие этому уровню академического превосходства является трудной задачей.

Представленный здесь прототип сосредоточен на вопросах демократии и экономического роста. Такое сужение фокуса привлекательно по двум причинам. Во-первых, литература по теме обширна и весьма достоверна (Acemoglu, Naidu, Restrepo, and Robinson, 2019, Pozuelo, Slipowitz, and Vuletin, 2016). Во-вторых, политические и экономические макросистемы являются системами более высокого порядка. Исследования на этом уровне являются вершиной методологической сложности, воображения и творчества (Мэнкив, 1995, с. 307, Линдауэр и Притчетт, 2002, с. 18).

Три столпа автоматизированного научного исследования

Получение больших данных

Мы живем в век больших данных. Большие данные — благодатная почва для гибкости при генерации гипотез. Такая гибкость является ключевым компонентом для достижения способности к научным открытиям на уровне человека (Гельман и Локен, 2014, Симмонс, Нельсон и Саймонсон, 2011).

В этом исследовании я использую базу данных WDI (CC BY 4.0). Показатели мирового развития — крупнейшая доступная база данных странового уровня. Он содержит 1400 индикаторов временных рядов для 217 стран и более 40 групп стран.

Поиск в области гипотез

Можем ли мы сделать наш диапазон исследования еще больше? Ответ — да, применяя тысячи моделей вместо одной. Каждая модель представляет одну гипотезу. Человеческие когнитивные ограничения не позволяют нам обрабатывать несколько гипотез одновременно. Преимущество ИИ в том, что он дает машинам возможность обучаться без явного программирования (Gründler and Krieger, 2016). Это гарантирует, что процесс открытия будет всеобъемлющим и свободным от человеческой предвзятости.

Поиск в пространстве гипотез также требует быстрого и масштабируемого алгоритма. В этом исследовании я опираюсь на современный ИИ-фреймворк — персептрон с линейной функцией активации и ограничениями пространственно-временного континуума.

Формирование теории

Следует помнить о резкой критике, предполагающей, что современный анализ больших данных основан на атеоретических исследованиях (Monroe, Pan, Roberts, Sen, and Sinclair, 2015). Теоретические представления о потенциальных механизмах, стоящих за чисто статистическими оценками, служат подстраховкой. Одна только оценка или только теория могут рассматриваться как слабые доказательства. Однако, когда они хорошо сочетаются друг с другом, они усиливают друг друга. Этот подход является первым строительным блоком симбиоза человека и машины, и его нельзя воспринимать легкомысленно. Таким образом, все оценки должны быть подкреплены твердой теорией.

Заключение

Мы находимся в разгаре революции искусственного интеллекта, и мы разделены. Есть те, кто видит в этом экзистенциальную угрозу, закат цивилизации, в свете которого человечество строит собственное вымирание. А есть те, кто считает, что эта функция уже здесь (Бем, 2011). Этот прототип — небольшой шаг вперед для оптимистов и очередная проигранная битва для методологических хулиганов (Singal, 2018)».