Мысли и теория

Имитация ученого: на пути к автоматизированным научным открытиям

Как создать двигатель научных открытий за 3 простых шага

Введение

В этой статье я покажу, как создать простой автоматизированный механизм научных открытий. Посмотрите демо.

Нынешняя научная практика ограничена нашими когнитивными и социологическими ограничениями. Машины быстрее, эффективнее и надежнее, чем мы. Самое главное, машины свободны от человеческих предубеждений. Интеграция искусственного интеллекта в научный процесс может привести к следующей научной революции.

Но возможна ли вообще автоматизация науки? Как ни слабо это сегодня, многие верят, что это не только возможно, но и в пределах нашей досягаемости. Институт Алана Тьюринга предложил задачу создать двигатель для научных открытий, который будет неотличим от высококлассных ученых-людей. Идея состоит в том, что четкая формулировка миссии с такой целью, как получение Нобелевской премии, — лучший способ ускорить выполнение задачи (Китано, 2021).

Будет ли машина неотличима от ученых-людей высшего уровня — это лишь одна часть головоломки. Знаменитый аргумент китайской комнаты утверждает, что простое использование синтаксических правил для манипулирования символами не приводит к реальному пониманию. Аналогичные опасения высказывались по поводу понимания научного процесса на человеческом уровне (Gigerenzer 2004, Altman 1994). Тем не менее, прохождение представленного варианта теста Тьюринга является необходимым первым шагом.

Указание области исследования

Первоначальное предложение ориентировано на биологические системы. Я утверждаю, что не биологические, а социальные системы менее всего поддаются автоматизации. Они представляют собой наиболее сложную, эпистемологически запутанную область для изучения. Поскольку социальные системы слишком сложны, чтобы люди могли рассуждать о них, автоматический поиск в огромном пространстве эмпирических гипотез является решающим шагом вперед. Решение этой проблемы для социальных наук послужило бы веским аргументом в пользу автоматизации в других дисциплинах.

Еще одна причина сосредоточиться на социальных системах — уровень зрелости, продемонстрированный исследователями социальных наук. Значение социальных исследований неизмеримо. Это подталкивает социологов к тому, чтобы быть на грани надежности, честности и прозрачности (Камерер и др., 2018, Открытое научное сотрудничество, 2015, Чанг и Ли, 2015). Соответствие этому уровню академического превосходства является трудной задачей.

Представленный здесь прототип сосредоточен на вопросах демократии и экономического роста. Такое сужение фокуса привлекательно по двум причинам. Во-первых, литература по теме обширна и весьма достоверна (Acemoglu, Naidu, Restrepo, and Robinson, 2019, Pozuelo, Slipowitz, and Vuletin, 2016). Во-вторых, политические и экономические макросистемы являются системами более высокого порядка. Исследования на этом уровне являются вершиной методологической сложности, воображения и творчества (Мэнкив, 1995, с. 307, Линдауэр и Притчетт, 2002, с. 18).

Три столпа автоматизированного научного исследования

Получение больших данных

Мы живем в век больших данных. Большие данные — благодатная почва для гибкости при генерации гипотез. Такая гибкость является ключевым компонентом для достижения способности к научным открытиям на уровне человека (Гельман и Локен, 2014, Симмонс, Нельсон и Саймонсон, 2011).

В этом исследовании я использую базу данных WDI (CC BY 4.0). Показатели мирового развития — крупнейшая доступная база данных странового уровня. Он содержит 1400 индикаторов временных рядов для 217 стран и более 40 групп стран.

Поиск в области гипотез

Можем ли мы сделать наш диапазон исследования еще больше? Ответ — да, применяя тысячи моделей вместо одной. Каждая модель представляет одну гипотезу. Человеческие когнитивные ограничения не позволяют нам обрабатывать несколько гипотез одновременно. Преимущество ИИ в том, что он дает машинам возможность обучаться без явного программирования (Gründler and Krieger, 2016). Это гарантирует, что процесс открытия будет всеобъемлющим и свободным от человеческой предвзятости.

Поиск в пространстве гипотез также требует быстрого и масштабируемого алгоритма. В этом исследовании я опираюсь на современный ИИ-фреймворк — персептрон с линейной функцией активации и ограничениями пространственно-временного континуума.

Формирование теории

Следует помнить о резкой критике, предполагающей, что современный анализ больших данных основан на атеоретических исследованиях (Monroe, Pan, Roberts, Sen, and Sinclair, 2015). Теоретические представления о потенциальных механизмах, стоящих за чисто статистическими оценками, служат подстраховкой. Одна только оценка или только теория могут рассматриваться как слабые доказательства. Однако, когда они хорошо сочетаются друг с другом, они усиливают друг друга. Этот подход является первым строительным блоком симбиоза человека и машины, и его нельзя воспринимать легкомысленно. Таким образом, все оценки должны быть подкреплены твердой теорией.

Заключение

Мы находимся в разгаре революции искусственного интеллекта, и мы разделены. Есть те, кто видит в этом экзистенциальную угрозу, закат цивилизации, в свете которого человечество строит собственное вымирание. А есть те, кто считает, что эта функция уже здесь (Бем, 2011). Этот прототип — небольшой шаг вперед для оптимистов и очередная проигранная битва для методологических хулиганов (Singal, 2018)».

Рекомендации

  1. Асемоглу, Д., Найду, С., Рестрепо, П., и Робинсон, Дж. А. (2019). Демократия вызывает рост. Журнал политической экономии, 127(1), 47–100.
  2. Альтман, Д.Г. (1994). Скандал из-за плохого медицинского исследования.
  3. Бем, DJ (2011). Ощущение будущего: экспериментальные доказательства аномального ретроактивного влияния на познание и аффект. Журнал личности и социальной психологии, 100(3), 407.
  4. Камерер, К.Ф., Дребер, А., Хольцмайстер, Ф., Хо, Т.Х., Хубер, Дж., Йоханнессон, М., … и Ву, Х. (2018). Оценка воспроизводимости экспериментов в области социальных наук в журнале Nature and Science в период с 2010 по 2015 год. Nature Human Behaviour, 2(9), 637–644.
  5. Чанг, AC, и Ли, П. (2015). Можно ли воспроизвести экономическое исследование? В шестидесяти опубликованных статьях из тринадцати журналов говорится «обычно нет».
  6. Гельман, А., и Локен, Э. (2014). Статистический кризис в науке: анализ, зависящий от данных — «сад расходящихся тропок» — объясняет, почему многие статистически значимые сравнения не выдерживают критики. Американский ученый, 102(6), 460–466.
  7. Гигеренцер, Г. (2004). Бестолковая статистика. Социально-экономический журнал, 33(5), 587–606.
  8. Грюндлер, К., и Кригер, Т. (2016). Демократия и рост: данные индикатора машинного обучения. Европейский журнал политической экономии, 45, 85–107.
  9. Хэнк, К., Арнольд, М., Гербер, А., и Шмельцер, М. (2019). Введение в эконометрику с Р. Университет Дуйсбург-Эссен.
  10. Китано, Х. (2021). Nobel Turing Challenge: создание двигателя для научных открытий. npj Systems Biology and Applications, 7(1), 1–12.
  11. Линдауэр, Д.Л., Притчетт, Л., Родрик, Д., и Эккаус, Р.С. (2002). В чем великая идея? Третье поколение политики экономического роста [с комментариями]. Экономика, 3(1), 1–39.
  12. Мэнкью, Н. Г., Фелпс, Э. С., и Ромер, П. М. (1995). Рост наций. Доклады Брукингса об экономической деятельности, 1995(1), 275–326.
  13. Монро, Б.Л., Пан, Дж., Робертс, М.Е., Сен, М., и Синклер, Б. (2015). Нет! Формальная теория, причинно-следственный вывод и большие данные не являются противоречащими направлениями в политической науке. PS: Политическая наука и политика, 48(1), 71–74.
  14. Сингал, Дж. (2018). Дебаты о методологическом терроризме внутри психологии. Срез. 12 октября. https://www.thecut.com/2016/10/inside-psychologys-methodological-terrorism-debate.html
  15. Посуэло, Дж., Слиповиц, А., и Вулетин, Г. (2016). Демократия не вызывает роста: важность аргументов эндогенности.
  16. Открытое научное сотрудничество. (2015). Оценка воспроизводимости психологической науки. Наука, 349(6251).
  17. Симмонс, Дж. П., Нельсон, Л. Д., и Симонсон, У. (2011). Ложно-положительная психология: нераскрытая гибкость в сборе и анализе данных позволяет представить что-либо как значимое. Психологическая наука, 22(11), 1359–1366.
  18. Большой вызов ученого Тьюринга по искусственному интеллекту https://www.turing.ac.uk/research/research-projects/turing-ai-scientist-grand-challenge
  19. Всемирный банк, Показатели мирового развития. https://datatopics.worldbank.org/world-development-indicators/