Глубокое обучение для машинной эмпатии: взаимодействие роботов и людей

Когда мы думаем о скором развитии следующей цифровой революции, человечество столкнется с беспрецедентной волной автоматизации. Все больше и больше умных и подключенных к Интернету устройств будут сосуществовать с нами. Эта революция уже происходит, от мобильных телефонов до автономных транспортных средств и даже наших холодильников. Что-то точно, роботы уже здесь, и они здесь, чтобы остаться.

Вопрос не в том, согласны ли мы, а в том, как мы будем взаимодействовать с этими новыми арендаторами. Помимо классических принципов дизайна, таких как практичность и стиль, актуальным станет новый критерий: машинная эмпатия. Эта тенденция будет усиливаться по мере того, как все больше компаний понимают, что взаимодействие человека с машиной (HMI) является ключом к безопасному внедрению технологий.

Но что мы можем сделать для улучшения взаимодействия человека с машиной? Можем ли мы хотя бы смягчить наше сосуществование?

Ключом к социальной интеграции является овладение способностью понимать, что другие люди чувствуют и думают, и соответствующим образом реагировать. До сих пор эта способность была зарезервирована только для (некоторых) людей. Эта добродетель, называемая сочувствием, улучшает социализацию, и люди по своей природе общительны.

Таким образом, ответ может заключаться в том, чтобы дать машинам возможность понять, что мы чувствуем, что нам нужно и каковы наши цели. Таким образом, они могут соответствующим образом отреагировать, максимизируя наш комфорт. Это также включает придание им правильной формы. Будет ли это новое поколение роботов гуманоидами? Нежные автоматы, как безобидный Roomba? Или, может быть, устрашающе, как собаки-роботы-металлисты Black Mirror и их настоящие дальние родственники из Boston Dynamics. Это часть единого целого при обсуждении HMI.

Многие исследователи работали в этой области, особенно группа Humanoid Robotics Group в Массачусетском технологическом институте. Они разработали социального робота Кисмет. Kismet ласково реагирует на эмоции зрителей, вовлекая людей в естественное и выразительное общение лицом к лицу. Предварительные результаты показывают значительное улучшение взаимодействия между людьми и этими машинами.

Очевидно, что успех этой новой волны входящей автоматизации будет в значительной степени зависеть от сочувствия и индивидуальности роботов. Представьте себе машину, которая определяет, что вы грустите, и автоматически воспроизводит песню, которая вам нравится, чтобы вы почувствовали себя лучше, или робота-медика, который распознает ваши потребности и реагирует, чтобы предоставить вам максимальное внимание и комфорт. Благодаря добавлению мощных функций автоматического распознавания речи и обработки естественного языка (широко разработанных Amazon Alexa и другими) возможности безграничны.

Такая система могла бы подпитываться внешними источниками информации, заставляя ее развиваться на основе опыта. Ваше устройство будет постоянно учиться у вас. Эта гипер-персонализация будет иметь прямое следствие: уникальность. Уникальность - это топливо привязанности, а привязанность по своей природе человеческая.

В фантастическом фильме «Настоящая сталь» (2011 г.) «Атом» робот-боксер несколько раз получает серьезные повреждения во время боя. Внезапно начинают появляться эмоции, как очевидный знак, мы не хотим проигрывать Атом; это уникально. Мы знаем, что делало Atom таким особенным по сравнению с другими роботами: он проявлял чувства; это было чутко.

Но не волнуйтесь, к тому времени облачные хранилища и телекоммуникационные технологии будут настолько развиты, что у вашего робота будет мало шансов потерять индивидуальность.

Неясно, как это может изменить технологическую отрасль и повлиять на привычки потребителей. Вы бы меняли машину так же часто, как раньше? Может ли у вас создаться впечатление, что ваше устройство уникальное? Сможете ли вы с ним связать?

Реальность такова, что у нас до сих пор нет ответов на эти вопросы. Эта революция начинается, и ее потенциальные последствия еще полностью не изучены. Затем эта тема станет частью открытого обсуждения в ближайшие годы.

Глубокое обучение и распознавание эмоций

Распознавание эмоций - это первый шаг на пути к созданию настоящих «чутких» машин. Такая система была успешно построена с использованием архитектур глубокого обучения, в частности сверточных нейронных сетей (CNN).

Секрет этого успеха заключается в способности CNN автоматически учиться определять соответствующие низко- и высокоуровневые характеристики входных изображений. Сеть генерирует все более явное представление изображения, обучаясь сочетать функции низкого и высокого уровня, чтобы, наконец, заботиться о фактическом содержании, а не об отдельных пикселях. Это окончательное представление используется для классификации эмоций по нескольким категориям, таким как грусть, радость, гнев, страх, удивление и нейтралитет. Очень подробное объяснение этого можно найти в печально известной статье Нейронный алгоритм для передачи стиля.

Следующее видео является результатом недельного погружения в распознавание эмоций в реальном времени с использованием глубоких сверточных нейронных сетей. Чтобы протестировать решение, мы выбрали знаменитое интервью «Грустный Бен Аффлек». Здесь показаны предварительные результаты (ожидаются дальнейшие улучшения):

В следующем посте мы перейдем непосредственно к реализации этого базового (и функционального) модуля эмпатии для роботов на основе глубокого обучения. Мы углубимся в методы компьютерного зрения, начиная от классических алгоритмов быстрого обнаружения лиц и заканчивая глубокими нейронными сетями для распознавания эмоций и передачи обучения.

Вопросов

Надеюсь, вам понравилась эта публикация так же, как и мне. Буду рад прочитать ваше мнение по этой теме. Не стесняйтесь оставлять свои комментарии, аплодисменты тоже приветствуются. Следуйте за мной, чтобы держать вас в курсе следующей части этой статьи. Если вы хотите узнать больше об Axionable, проектах и карьере, посетите наш сайт и подпишитесь на нас в Twitter.

Библиография

Бризил, К. (2000), «Общительные машины: выразительный социальный обмен между людьми и роботами». Sc.D. докторская диссертация, Департамент электротехники и информатики, Массачусетский технологический институт.

Гэтис, Л.А., Эккер, А.С., и Бетге, М. (2015). Нейроалгоритм художественного стиля. CoRR, абс. / 1508.06576.

Глубокое обучение для машинной эмпатии: взаимодействие роботов и людей - Часть I

Глубокое обучение и распознавание эмоций

Вопросов

Вопросы по теме