Как AutoML второго поколения вытеснит разработку программного обеспечения изнутри

Я только что вернулся после нескольких недель, проведенных в Европе, выступая на различных конференциях по AI и ML. Несмотря на наши многочисленные сообщения по этой теме, я на самом деле не люблю говорить о том, почему Auger.AI является лучшим продуктом AutoML. Вместо этого то, о чем я говорил, - это то, где я вижу все эти инновации в заголовке AutoML.

Автоматизированное машинное обучение «первого поколения» было ориентировано на «гражданских специалистов по данным». Бизнес-аналитикам нужно что-то предсказать или классифицировать. Они загружают свою электронную таблицу в службу. Сервис предоставляет «таблицу лидеров» выигрышных алгоритмов и множество дополнительных виджетов для более детального понимания обученных моделей. Исходя из этого, бизнес-аналитик делает выбор, какую модель он хочет использовать для прогнозов. Это первое поколение AutoML обеспечило реальную ценность как для того, чтобы побудить нетехнических пользователей увидеть ценность машинного обучения в целом, так и для повышения точности с учетом решения использовать машинное обучение для более точных прогнозов.

Но потенциал машинного обучения выходит далеко за рамки бизнес-аналитика. Другие поставщики AutoML начинают видеть эти возможности. Не стараясь изо всех сил указывать на их природу, ориентированную на разработчиков, и на то, что она дает, предложения AutoML как от Google, так и от Microsoft действительно очень ориентированы на программистов. Таблицы лидеров не видно.

Мы в Auger.AI считаем, что такая полная автоматизация автоматизированного машинного обучения представляет второе поколение AutoML и открывает возможности для нового класса проектов машинного обучения. Вместо того, чтобы работать над большими многонедельными (или многомесячными) проектами машинного обучения с командами специалистов по данным, небольшие микро-решения в каждом важном корпоративном приложении можно автоматизировать и определять с помощью AutoML. Это гораздо более серьезное потенциальное изменение, чем решение того, что люди считают самой насущной проблемой прогнозирования.

ИИ действительно пожирает программное обеспечение. Как отметил Марк Андриссен в 2011 году, Программное обеспечение съедает мир. Этот переход во многом уже произошел. Каждая часть такого программного обеспечения станет интеллектуальной. Вместо того, чтобы программисты писали сотни строк кода с операторами if-then-elseif-else и операторами switch-case, эти суждения можно делать с помощью небольших моделей прогнозирования. Вместо того, чтобы пользователи программного обеспечения пробирались через вложенные меню, чтобы найти свои действия (например, выбор учетной записи, с которой нужно связаться следующей в своей CRM, определение лучшего показателя в медицинском диагнозе), программное обеспечение будет предлагать наиболее вероятные варианты выбора на усмотрение пользователя. В других контекстах при достаточной точности и в зависимости от проблемной области решения могут приниматься полностью автоматически.

Auger.AI, таблицы Google AutoML и API Microsoft Azure AutoML очень ориентированы на этот сценарий автоматизированного AutoML. На самом деле у них больше общего, чем различий. Все они следуют тому, что мы называем конвейером PREDIT:
- Я переношу данные в инфраструктуру AutoML
- T Эксперимент AutoML : попробуйте десятки алгоритмов и сотни настроек гиперпараметров, чтобы найти лучшую модель
- E оценить лучшую модель
- D применить модель
- P перенаправить новые цели на основе недавно обнаруженных данных
- R изучить реальную эффективность модели.

Трудно вспомнить «ITEDPR», поэтому мы придумали для него банальную, но запоминающуюся анаграмму: PREDIT (по-французски «предсказывать»), конвейер. Все этапы полного конвейера PREDIT (автоматический ввод данных, обучение, развертывание, прогнозирование и проверка производительности модели с последующим повторным импортом и повторным обучением данных) важны в любом приложении, которое хочет максимально использовать преимущества AutoML без постоянного «Ученый-гражданин» в цикле.

Мы ввели общий уровень API с открытым исходным кодом, который отражает этот общий конвейер PREDIT Automated AutoML. Мы называем это A2ML от Автоматизированный AutoML. A2ML поддерживает Auger.AI и Google AutoML Tables сегодня [Примечание: мы работаем над полной поддержкой Azure AutoML]. Упомянутые Google и собственные API-интерфейсы AutoML для Azure очень подробно описаны в своих возможностях, но их использование по крайней мере в 20 раз более подробное, поскольку они являются надстройками к основным облачным возможностям Google Cloud и Microsoft Azure. Мы также считаем, что замена программной логики на машинное обучение - это настолько фундаментальный сдвиг, что для этого нужна компания и специализированный продукт (а не надстройка облачного сервиса), но это само по себе является темой другого поста.

Таким образом, мы считаем, что общие API-интерфейсы для AutoML, доступные как формальный стандарт или стандарт де-факто за счет широкого внедрения, ускорят этот процесс AI Eating Software: предоставят более качественные приложения для предприятий и пользователей и резко увеличат продуктивность разработчиков. В последующих публикациях здесь A2ML API будет обсуждаться более подробно.