Три основных столпа машинного обучения

Большинство из вас слышали о контролируемом и неконтролируемом обучении. Некоторые из вас даже слышали об обучении с подкреплением. Но почему у нас разные типы обучения?

В этой короткой статье я расскажу о различиях между ними и, надеюсь, устраню всю путаницу. Итак, начнем.

Введение

Я предполагаю, что вы уже убедились, что машинное обучение — это мощный инструмент, который может помочь нам решить проблемы, которые трудно решить вручную, например: перевод (например, с английского на французский) или семантическую сегментацию (например, какие пиксели принадлежат кошке).

Я также предполагаю, что вы знаете, что данные играют решающую роль в этом процессе. Тексты или изображения, мы используем содержащуюся в них информацию для создания решений машинного обучения.

Какое это имеет отношение к упомянутым выше типам обучения? Ну, именно то, как эти данные отформатированы, поможет нам выбрать подходящую модель машинного обучения, чтобы извлечь из нее уроки.

контролируемое обучение

Обучение с учителем является наиболее распространенным подходом. Здесь данные представляют собой набор пар (вход, выход). Например, по предложению на английском языке (ввод) модель предсказывает его настроение (вывод). Или, учитывая изображение с лицом (вход), модель создает ограничивающую рамку (выход) над лицом на изображении, если оно существует.

Откуда взялось это название?
Название происходит от понятия внешнего объекта, называемого супервизором, который обеспечивает вывод для каждого ввода данных.

Неконтролируемое обучение

При неконтролируемом обучении данные представляют собой только набор входных данных. Чего ждать? Как модель может учиться таким образом? Оказывается, многое можно узнать из самого ввода. Например, при заданном наборе документов модель группирует их на основе сходства. Или, учитывая изображение, модель сжимает его.

Откуда взялось это имя?
Здесь руководитель не существует, поэтому вывод не предоставляется.

Самостоятельное обучение

Хотя обучение с самоконтролем является подкатегорией обучения с учителем, я решил поместить его здесь, потому что оно объединяет как обучение с учителем, так и обучение без учителя.

Напомним, что при неконтролируемом обучении данные представляли собой набор входных данных. Можем ли мы преобразовать каждый из входных данных в набор пар (входных и выходных), подобных тем, которые используются в обучении с учителем? Конечно можем. Например, учитывая предложение (исходный ввод), модель предсказывает слово (выход), которое следует за последовательностью слов (вход) в предложении. Или, учитывая изображение (исходный ввод), модель предсказывает, исходят ли одно дополненное представление изображения (вход) и другое дополненное представление изображения (выход) из исходного изображения.

Откуда такое название?
Здесь супервайзер — это сам вход, отсюда и самоконтроль.

Обучение с подкреплением

Обучение с подкреплением приобрело большую привлекательность в новейшей истории. Это совершенно другой подход, чем предыдущие. Здесь модель или агент узнает, какое действие является наиболее оптимальным в каждом состоянии среды. Данные не даются заранее, как раньше. Скорее, это вознаграждение за выбранное действие. Затем агент пытается максимизировать совокупное вознаграждение, взаимодействуя с окружающей средой.

Откуда взялось это название?
Название происходит от понятия подкрепления оптимального поведения путем предоставления агенту положительного (или отрицательного) вознаграждения.

Похвальный отзыв

Одно почетное упоминание — полуконтролируемое обучение. Здесь набор данных представляет собой смесь как пар (входных, выходных), так и только входных данных. Он редко используется на практике, но стоит упомянуть заинтересованному читателю.

Заключение

Учитывая последние достижения в области машинного обучения, я думаю, что когда-нибудь в будущем мне придется вернуться к этой статье. На данный момент я надеюсь, что вы лучше понимаете текущие типы обучения и их различия между собой.