В предыдущем посте мы узнали, что вы вряд ли найдете успешное приложение без применения ИИ в будущем, и машинное обучение играет важную роль в этом будущем. Машинное обучение — это область ИИ, в которой алгоритмы не программируются явно для выполнения задачи, а учатся и совершенствуются на основе опыта (данных). Существует множество типов алгоритмов машинного обучения, некоторые из которых более известны, чем другие, которые можно применять для решения различных задач. Здесь мы даем краткий обзор некоторых важных областей и их приложений.

Контролируемое обучение

В этой настройке нам дается набор помеченных обучающих экземпляров, и мы хотели бы изучить модель, отражающую основные характеристики данных, s.t. мы можем делать прогнозы о невидимых экземплярах. Существует два основных типа, которые различаются по типу этикеток.

Метки могут быть категориальными, например, когда мы хотим оценить, является ли входящее электронное письмо законным или просто спамом. Здесь данные, из которых мы изучаем, состоят из старых электронных писем, для которых мы знаем ярлыки, и мы относим входящие электронные письма к одному из двух классов, поэтому это называется задачей классификации.

Если, с другой стороны, метки непрерывны, это называется регрессией. Например, зная цены на дома в нашем районе, с некоторыми дополнительными параметрами, такими как площадь и год постройки, мы можем найти реальную рыночную стоимость нашего собственного дома.

Неконтролируемое обучение

При обучении без учителя у нас, как и в случае обучения с учителем, есть набор данных, из которого мы учимся. Данные, однако, не помечены. Эта задача кажется намного более сложной, поскольку машине не предоставляется информация о этикетке, присутствующая в контролируемой настройке.

Кластеризация – наиболее яркий пример обучения без учителя. Здесь мы стремимся обнаружить внутреннюю группировку данных. Например, мы хотели бы сгруппировать наших клиентов, чтобы предсказать покупательское поведение или вероятность оттока, или найти правильный подход к предоставлению стимулов на основе характеристик группы, к которой принадлежит клиент.

Обучение с подкреплением

Короче говоря, в обучении с подкреплением интеллектуальный агент, например. мышь в лабиринте, пытается найти правильную серию действий (движение влево/вправо/вверх/вниз), чтобы достичь своей цели сыр. Для этого политика оптимизируется на основе взаимодействия агента со средой. Мышь должна найти правильный баланс между разведкой и эксплуатацией, то есть между долгосрочной и краткосрочной выгодой.

Обучение с подкреплением предназначено не только для мышей или лабиринтов, но и очень удобно, когда мы хотим, чтобы машина научилась играть в игру го, или найти подходящую рекламу для показа пользователю на YouTube, чтобы максимизировать общий выигрыш. . Проще говоря, всякий раз, когда машина взаимодействует с окружающей средой и может улучшить свою политику на основе результатов.

Это всего лишь краткий (не исчерпывающий) обзор некоторых областей машинного обучения, показывающий богатый набор инструментов, имеющихся в нашем распоряжении.

Спасибо, что прочитали! Если вам понравилась эта статья, поставьте👏

Скажи привет в: Twitter | ЛинкедИн