Знаете ли вы, что роботы могут использовать языковые модели для понимания инструкций и даже для написания…

Представьте, что вы спешите к дедлайну. Вы яростно печатаете на клавиатуре и даже не можете оторвать глаз от экрана. Вы должны покончить с делами, довести дело до конца, как можно скорее. Затем вы решаете, что дополнительный глоток кофеина будет полезен для бодрости, и рассеянно протягиваете руку, чтобы взять кофе, который стоит рядом с вашим ноутбуком… в итоге проливая его на весь рабочий стол! Да, я знаю, ты был там раньше.

А теперь представьте, что, просто сказав: Можете ли вы дать мне что-нибудь, чтобы убрать этот беспорядок?, робот сам соображает, что произошло, перемещается на кухню и подходит к вам с губкой, чтобы вы ее устранили. Что ж, как бы это ни звучало из научной фантастики, скоро это может произойти благодаря тем же алгоритмам искусственного интеллекта, которые используются учащимися для выполнения домашних заданий.

Управляемые искусственным интеллектом большие модели обработки естественного языка (NLP), такие как BERT, GPT и PaLM, продемонстрировали большой потенциал для завершения кода, подсказки изображения и имитации разговора. Эксперты по робототехнике и Исследователи данных использовали эту технологию для создания новых приложений для автоматизации задач.

Не так давно Google анонсировала PaLM-SayCan, алгоритм робототехники, который помогает людям лучше взаимодействовать с роботами. Поскольку машины с трудом понимают инструкции, требующие некоторого рассуждения, исследователи предложили использовать мощь современной модели НЛП PaLM, чтобы сделать подсказки для них намного проще.

Следовательно, когда человек говорит что-то вроде Я только что позанимался, не могли бы вы принести мне выпить и перекусить, чтобы восстановиться?, PaLM использует технику, известную как подсказка по цепочке мыслей, чтобы расшифровать фактический запрос, производя в этом случае выражение Пользователь попросил выпить и перекусить. Я принесу бутылку с водой и яблоко. Таким образом, роботы могут использовать эту информацию для оценки вероятности того, что отдельный навык будет способствовать выполнению инструкции высокого уровня, самостоятельно решая, что делать, чтобы выполнить ее.

Совсем недавно другая команда из Google создала Code as Policies. Это еще один шаг вперед, так как вместо того, чтобы генерировать предложения на естественном языке, которые роботу легче интерпретировать, сеть НЛП применяется для автоматического создания блоков кода для робота с инструкциями, которым нужно следовать. Это, в сочетании с API-интерфейсом восприятия, управляемым инструментами компьютерного зрения, и API-интерфейсом действий с заранее определенным набором навыков, позволяет роботам делать то, о чем их просят, без явного программирования для этого. Кроме того, запросы могут быть представлены гораздо более выразительно и естественно, что является большим шагом на пути к тому, чтобы сделать роботов более удобными в использовании.

Эти эксперименты на стыке ИИ и робототехники с каждым днем становятся все более реальными, переходя от лабораторных столов к повседневной жизни. Например, американская компания Everyday Robots, которая сотрудничает с Google для улучшения своих продуктов, уже создает роботов-помощников, способных самостоятельно научиться помогать кому угодно практически во всем.

Какие приложения вы предполагаете для крупномасштабных языковых моделей в вашем бизнесе? Свяжитесь с нами, чтобы мы могли помочь вам выполнить их в Arionkoder!

Первоначально опубликовано на https://blog.arionkoder.com 11 ноября 2022 г.

Знаете ли вы, что роботы могут использовать языковые модели для понимания инструкций и даже для написания…

Вопросы по теме