Руководство по основам машинного обучения

Область машинного обучения относится к искусственному интеллекту (ИИ). Это позволяет системам получать, объединять и улучшать знания из большого количества данных. Все это возможно даже без программирования. Этот динамичный термин придумал один из сотрудников IBM по имени Артур Сэмюэл. Сегодня алгоритмы машинного обучения, включая обработку естественного языка, роботизированное зрение, распознавание речи, обработку изображений и т. д., находятся на пике своего развития.

Что такое машинное обучение?

Это жизненно важная часть последних технологических разработок, объем рынка которых составляет 328,34 миллиарда долларов.

Машина обучается, когда она меняет свою форму, программу или данные, чтобы улучшить ожидаемый результат (на основе своих входных данных или в ответ на внешнюю информацию). Некоторые изменения, такие как добавление записи в базу данных, возможно, правильнее называть изменениями в других областях. Например, можно сказать, что производительность машины распознавания речи улучшается после прослушивания нескольких образцов речи пользователя. Машинное обучение означает определенные изменения в системах, которые выполняют задачи, связанные с ИИ, такие как планирование, прогнозирование, диагностика и т. д. Эти изменения могут быть либо улучшениями существующих систем, либо созданием новых систем с нуля. Такие агенты наблюдают и моделируют свое окружение для расчета соответствующих действий, возможно, предвидя результат этих действий. Обучение может быть связано с любыми изменениями, внесенными в компоненты, показанные на рисунке. Механизмы обучения могут различаться в зависимости от того, какую подсистему необходимо модифицировать.

Зачем нужно машинное обучение

Задача не может быть хорошо описана, если мы не покажем ее на примере; например, пары вход/выход могут быть определены, но связь между входами и выходами не может быть описана. Машины должны быть способны адаптировать свою внутреннюю структуру для получения правильных выходных данных для различных входных выборок. В результате их функция ввода/вывода может быть надлежащим образом ограничена, чтобы аппроксимировать взаимосвязь, подразумеваемую в примерах.
Среди огромных груд данных могут быть корреляции и отношения. Интеллектуальный анализ данных часто используется для извлечения этих отношений (машинное обучение). Иногда дизайнеры-люди создают машины, которые плохо работают в своей среде. При проектировании рабочей среды некоторые характеристики могут быть неизвестны полностью. Существующие конструкции машин можно улучшать в процессе работы с помощью методов машинного обучения.
Вполне возможно, что люди не могут явно закодировать все знания об определенных задачах. Это знание может лучше усваиваться машинами, которые постепенно изучают его, чем люди. Со временем среда меняется. Необходимость постоянного перепроектирования машин уменьшилась бы, если бы они могли адаптироваться к меняющейся среде. Люди постоянно открывают для себя новую информацию о задачах. Произошло изменение лексики. Мир постоянно наводнен последними событиями. Перепроектирование систем ИИ с учетом меняющихся знаний нецелесообразно, но методы машинного обучения могут отследить некоторые из них.

Подходы к машинному обучению

контролируемое обучение

Он начинается с обычного набора данных и понимания его классификации. Он направлен на поиск похожих шаблонов данных, которые имеют определенные функции. Рассмотрим, например, множество растений, включая их объяснения. Вы можете разработать приложение с машинным обучением для классификации видов растений. Определив атрибуты данных и их значение, пользователи могут обучить их так, чтобы метки соответствовали смоделированным данным. Всякий раз, когда метка непрерывна, данные представляют собой регрессию; когда она конечна, это классификация. Цель регрессии, используемой в обучении с учителем, состоит в том, чтобы понять, как коррелируют переменные.

Эти модели имеют приложения для решения проблем, связанных с бизнесом, выявлением мошенничества, анализом рисков и распознаванием речи. После обучения алгоритмов на предварительно обработанных примерах результаты алгоритмов оцениваются с помощью тестовых данных. Бывают случаи, когда закономерности, обнаруженные в подмножестве данных, невозможно увидеть в большей совокупности. Переоснащение происходит, когда модель подходит исключительно для представления шаблонов обучающего подмножества. Переобученная модель — это модель, которая была настроена специально для обучающих данных, но может не применяться к большим неизвестным наборам данных. Тесты должны выполняться на непредсказуемых или незнакомых размеченных данных для контроля переобучения. Тестирование модели с непредвиденными данными может помочь вам оценить ее точность в прогнозировании результатов.

Неконтролируемое обучение

Это подходит для работы с огромным количеством неразмеченных данных. Рассмотрим все приложения для социальных сетей, содержащие большие объемы неразмеченных данных. Определенные алгоритмы необходимы для классификации этих данных в соответствии с их шаблонами. Рассмотрим, например, обнаружение спама в Gmail. Эти нежелательные электронные письма распознаются программами машинного обучения.

Алгоритмы неконтролируемого обучения упорядочивают данные по группам признаков. Именно немаркированные данные определяют значения параметров и классификацию данных. В результате этого процесса данные становятся контролируемыми путем добавления меток. Когда имеется огромное количество данных, неконтролируемое обучение может определить результат. Разработчики понятия не имеют, как будут использоваться данные, поэтому маркировка на данном этапе невозможна. Таким образом, обучение без учителя можно использовать в качестве первого шага перед передачей данных обучению с учителем. Эта стратегия может определить результаты быстрее, чем контролируемое обучение.

Усиленное обучение

При таком подходе пользователи ориентируются на наилучшие результаты благодаря обратной связи алгоритма, полученной в результате анализа. Здесь система учится методом проб и ошибок, а не обучается с набором выборочных данных. Иными словами, после ряда успешных решений процесс будет «усилен», так как решает проблему наилучшим образом.

Рассмотрим область робототехники. часто действия или навигация достигаются методом проб и ошибок. Робот может изменять ход своих действий в соответствии с желаемым результатом. Алгоритмы обучения должны определять взаимосвязь между предполагаемыми результатами и последовательностью шагов. Самоуправляемый автомобиль также является хорошим примером усиленного обучения. Он должен пересекать дорожные препятствия, обращать внимание на сигналы светофора и двигаться плавно.

В этой статье мы рассмотрели основы машинного обучения, его потребности и популярные подходы. Всегда полезно начать изучать машинное обучение на основе моделей вместо программирования.