Первоначально опубликовано на http://thescinder.com / 2021/07/12 / the-fitness-hypothesis / 12 июля 2021 г.

Цель этого эссе - утверждать, определять, приводить примеры и, прежде всего, способствовать дебатам вокруг нижеупомянутой научной гипотезы:

Цели максимального улучшения физической формы в данном контексте достаточно, чтобы управлять всем, что мы подразумеваем под разумным поведением.

Вышеупомянутая гипотеза резко контрастирует с ведущей философией «старого доброго искусственного интеллекта», которая обычно полагается на привитие экспертных знаний и точных формулировок задач в правила, которым могут следовать машинные агенты. Гипотеза пригодности, с другой стороны, является естественным продолжением того, что мы узнали за последние несколько десятилетий в эпоху современного искусственного интеллекта. Опыт снова и снова учит нас, что тщательно сформулированные программы и спецификации задач не соответствуют производительности более общих правил обучения и упрощенных целей (например, см. «Горький урок» Саттона) при наличии достаточных вычислительных ресурсов.

В рамках обучения с подкреплением обучающие агенты в достаточно большом масштабе, стремящиеся только максимизировать простые скалярные вознаграждения, постоянно превосходят по эффективности написанные вручную экспертные программы, а также людей. Зачастую агенты глубокого обучения с подкреплением находят решения проблем, которые шокируют, сбивают с толку и оскорбляют их создателей, и даже открывают настолько творческие стратегии, что их отвергнут, если они будут разработаны в какой-либо сфере. другой путь. Но накопленные награды не лгут. Стратегия, которая приносит значительно более высокие вознаграждения, независимо от того, насколько они уродливы или опасны, по определению является лучшим решением и, следовательно, продуктом превосходного интеллекта для решения проблем применительно к проблеме максимизации вознаграждения.

Однако скрытие чуть ниже поверхности универсальности обучения с подкреплением - еще более мощная идея и естественный прогресс в поисках общего искусственного интеллекта. Это гипотеза пригодности, проверенный и многообещающий путь к общему интеллекту. Это более простая и, следовательно, лучшая альтернатива как современным, так и старомодным подходам к ИИ, и даже имеет определенные преимущества перед гипотезой вознаграждения. Согласно гипотезе пригодности, мы можем избавиться от целевых функций и свести все проблемы к одной директиве, очень простой для описания и которую можно рассматривать как нулевой закон интеллекта: не прекращайте существовать .

Мы также предполагаем, что агенты и системы, которые выживают с помощью проб и ошибок, могут в конечном итоге проявить большинство, если не все аспекты интеллекта, включая социальный интеллект, хитрость, творчество, язык и чувство юмора. Следовательно, суперспособные эволюционные агенты и системы агентов могут представлять собой мощное решение для общего искусственного интеллекта.

Нам не нужны награды, куда бы мы ни пошли.

Чтобы полностью понять гипотезу пригодности и ее разветвления, нам нужно уточнить, что именно мы подразумеваем под «разумным поведением», «приспособленностью» и, конечно же, «данным контекстом».

  1. Интеллект можно описать как способность отдельных лиц и групп предпринимать действия, которые наилучшим образом решают проблему максимального увеличения их выживания.
  2. Цели максимизации приспособленности в данном контексте достаточно, чтобы управлять всем тем, что мы подразумеваем под разумным поведением.
  3. Пригодность определяется как мера способности отдельных лиц и групп выживать в окружающей среде.

Важно понимать, что сама приспособленность и, следовательно, определение интеллекта могут резко меняться в разных средах. Вершина интеллекта была занята различными стратегиями выживания, используемыми архаическими динозаврами. Эти стратегии демонстрировали выдающуюся физическую форму вплоть до того момента, когда этого не происходило, когда крупные и специализированные планы тела, используемые нептичьими динозаврами, оказались не такими уж умными в контексте массивного метеорологического нарушения воздействия KT. Новый стандарт интеллекта возник в последующем контексте окружающей среды, когда мелкие млекопитающие превратились в крупных млекопитающих, а млекопитающие с большим мозгом открыли, как использовать огонь.

Теперь, в мире, где эволюционный отбор определяется способностью сосуществовать с этими крупномозговыми млекопитающими (людьми), появился еще один новый тип интеллекта. Выбранная новая экспериментальная версия интеллекта - это система машинных агентов, находящаяся под сильно изменчивым давлением отбора, зависящим от культурных прихотей человеческих исследований и инженерии. Хотя они не всегда могут казаться такими умными, они обязательно останутся умными, если их поведение благоприятствует избирательному давлению в их среде.