Если вы строите будущее, трудно избежать небольшой шумихи. Обещание лучшего будущего вдохновляет предпринимателей, инвесторов и потребителей, которые поддерживают цикл инноваций. Но шумиха может быть сложной, особенно для ИИ. Понять, что ИИ может и должен делать, сложно даже экспертам.

Гонка вооружений автономных автомобилей идет полным ходом, и крупнейшие мировые игроки борются за позиции как в технологическом, так и в общественном мнении. В настоящее время 60 компаний имеют право тестировать свои беспилотные автомобили на дорогах Калифорнии, и каждые несколько недель наша отрасль появляется в новостях с новым графиком, демонстрацией или запуском продукта.

Часто гонка вооружений измеряется в пройденных милях, что имеет определенный смысл. Статистические данные об общем количестве пройденных миль являются важным показателем того, насколько серьезно игроки относятся к достижению Уровня 4 — высокоавтоматизированного вождения — и выше. Но эта статистика тоже часть хайпа. Они используются в маркетинговых целях или для того, чтобы запугать конкурентов, заставив их поверить в то, что один игрок имеет непреодолимое преимущество над другими в выводе на рынок AV.

Например, Waymo объявила, что ее автомобили преодолели 10 миллионов миль в прошлом месяце, а на этой неделе им дали зеленый свет на испытания полностью беспилотных автомобилей без водителей безопасности в Калифорнии. Uber, Tesla, Mobileye, Cruise и другие не отстают — все с целью снижения дорожно-транспортных происшествий. Тем не менее, несмотря на то, что наши автомобили проезжают больше миль, мы все еще создаем автомобили, подверженные авариям.

С тех пор как в 2014 году Калифорнийский DMV ввел новые правила в отношении беспилотных автомобилей, было собрано более 100 отчетов о столкновениях с беспилотниками, половина из которых произошла в этом году, поскольку на улицы выехало больше автомобилей. Напрашивается вопрос, есть ли более глубокая история, чем больше миль = лучшие машины. Бывают ли ситуации, когда вождения недостаточно?

Нет никаких сомнений в том, что автономные автомобили должны ездить по настоящим дорогам. Алгоритмы машинного обучения повышают точность с увеличением количества данных, а для беспилотных автомобилей мили равны данным. Вы можете тестировать автомобили в симуляции — это удобно, потому что самые важные данные могут быть получены из обстоятельств, которые случаются не очень часто. Данные помогают только тогда, когда они содержат информацию, которую вам нужно знать. Но мы даже не можем себе представить, сколько информации нам нужно при вождении автомобиля, потому что, как люди, мы полагаемся на обширную врожденную способность понимать мир вокруг нас — то, чему вы не научитесь, просто проехав больше миль.

Когда человек — до сих пор действующий чемпион по вождению — водит машину, что он делает? От каких навыков и знаний они зависят? Как они научились этим навыкам? Размышляя над этими вопросами, мы начинаем понимать, что вождение может включать в себя нечто большее, чем просто вождение.

Подсознание вождения

Человеческий мозг умеет рассказывать истории о мире. На вопрос, какие навыки мы используем для вождения, у нас есть множество ответов. Вы должны уметь управлять и знать, где находятся края автомобиля. Нужно знать правила дорожного движения и что означают разные знаки. Вы должны уметь объезжать препятствия, соответствовать скорости движения и знать, где находится дорога и по какой ее части нужно ехать.

Конечно, все в этом списке необходимо для вождения, и они рассказывают довольно хорошую историю о том, что влечет за собой вождение. Единственная общая характеристика всех этих навыков заключается в том, что это то, чему человек должен научиться, чтобы сдать экзамен на вождение. Однако им не хватает элементов вождения, которые выполняются настолько легко, что мы даже не замечаем их выполнения, и настолько автоматически, что даже если бы нас спросили, как мы это сделали, мы бы не знали, что ответить.

Примером, не связанным напрямую с вождением, является распознавание лиц. Представьте лицо своего лучшего друга. Теперь объясните, как вы можете их распознать. Вы можете начать с перечисления их черт лица или цвета их глаз и волос, но многие люди попадают в категорию каштановых волос и карих глаз.

Тогда ваш мозг может рассказать историю с другими рассуждениями, такими как «он всегда носит эту шляпу», «у нее нос как у матери» или «я узнаю эти волосы где угодно». Основной ответ на самом деле таков: «они похожи на самих себя». У вас нет сознательного доступа к функциям, которые вы используете для распознавания знакомого лица. Функции есть, и вы полагаетесь на них, но у вас не обязательно есть возможность их описать.

Мы эволюционировали, чтобы хорошо делать что-то без сознательного доступа к тому, как мы это делаем. Этим способностям нельзя научиться, и по этой причине им, как правило, труднее всего научить компьютеры. Наша способность понимать других людей и предсказывать их действия относится к этой категории. Мы эволюционировали, чтобы делать это. Способность выносить совместные социальные суждения могла быть единственным эволюционным изменением, которое привело к взрыву человеческого интеллекта.

Комбинаторный взрыв в зеркале

Глядя на кого-то другого и делая выводы о том, что у него в голове, мы часто делаем за рулем. Когда мы видим кого-то на улице, будь то в машине, на велосипеде или на прогулке, мы делаем о нем выводы. Эти выводы могут или не могут напрямую соотноситься с задачей вождения, но жизненно важны для вождения автомобиля.

Возьмите понимание, хочет ли кто-то перейти улицу. Кто-то может стоять у дороги, но, может быть, они ждут автобуса. Они могли идти по дороге, но садились в машину. Они могут стоять на месте, ожидая просвета в движении, чтобы перейти дорогу, или идти параллельно дороге по той же причине.

Люди могут оценивать эти обстоятельства мгновенно и без усилий, в то время как машины полагаются на контекстуальные сигналы — наличие пешеходного перехода или светофора — которые информативны, но недостаточны. Чтобы понять, что кто-то собирается делать, исходя из контекста, вам нужен не только весь контекст — тот мчащийся за углом автомобиль, который пешеход может видеть, а вы — нет, — вам нужно много-много примеров.

Количество необходимых данных зависит от того, что математики называют «комбинаторным взрывом». Чем дальше вы пытаетесь предсказать, тем сложнее становится предсказание. Даже если мы проедем миллиард миль, мы все равно не увидим всех комбинаций факторов, которые могут повлиять на то, что кто-то встанет перед нашей машиной.

Поведение человека — одна из самых сложных проблем. Неясно даже, сколько данных нам может понадобиться, чтобы понять людей, и сможем ли мы собрать достаточно данных, чтобы научить машину делать выводы. Мы не учимся этим вещам; мы рождаемся со способностью подсознательно приобретать невероятно сложный набор инструментов социального рассуждения.

По мере того, как шумиха вокруг обещаний беспилотных автомобилей начинает оседать, мы все больше осознаем, насколько сложно научить машину водить. У нас есть руководство для водителя, и мы научили компьютеры им следовать, но нам нужно выйти за рамки черно-белого — за пределы пройденных миль — и начать более критически относиться к когнитивной науке за рулем.