Контролируемое, неконтролируемое и обучение с подкреплением. Три столпа машинного обучения.

Вы когда-нибудь слышали, чтобы люди упоминали контролируемое или неконтролируемое обучение, когда говорили о методах машинного обучения? Задумывались ли вы, означает ли это, что для некоторых техник вам нужно сидеть и смотреть, как компьютер делает свое дело, а для других нужно, чтобы вы ушли, чтобы он заработал?

Эта статья поможет вам понять, в чем разница между контролируемым и неконтролируемым обучением и как они используются в повседневной жизни специалистов по данным.

Так в чем же в чем разница?

Реальность такова, что основное различие между двумя типами методов машинного обучения сводится к данным, а именно к наличию доступных меток данных.

Помимо типов используемых данных, они также различаются по своим целям. Методы с учителем используются для прогнозирования того, что произойдет, когда модель увидит новые данные, в то время как методы без учителя используются для получения (надеюсь!) ценной информации из новых данных и предоставления отзывов о том, что она считает нетипичным или интересным.

Что такое контролируемое обучение?

Алгоритмы контролируемого обучения используют помеченные наборы данных для обучения модели, которые затем можно использовать для таких целей, как:

Классификация
Регрессия

Классификация в этом контексте — это использование моделей машинного обучения для группировки данных в отдельные группы. Возможно, вы видели примеры этого в забавных инструментах, которые могут сказать вам, изображена ли на картинке кошка или собака. Многие технологии в мире используют алгоритмы классификации, чтобы помочь нам в нашей повседневной жизни, в том числе:

Системы распознавания лиц
Финансовые приложения
Прогноз погоды

Регрессия использует модели помеченных данных для прогнозирования значений неизвестных с использованием предыдущих данных. Отличным примером этого является прогноз цен на жилье в районе. Другие примеры регрессии в мире включают:

Тенденции фондового рынка
Предсказание роста ребенка
Прогнозирование влияния удобрений на урожайность

Таким образом, мы уже можем получить представление о том, как обучение с учителем можно использовать для улучшения нашей повседневной жизни и помощи в принятии решений на основе данных.

Если вы хотите узнать больше об алгоритмах машинного обучения с учителем, посмотрите мои сообщения о деревьях решений и линейной регрессии:

Машинное обучение для детей — деревья решений
medium.com

Сколько яиц я получу? Линейная регрессия может рассказать вам об этом.
Вы слышали выражение «не считай цыплят, пока они не вылупились? Ну, теперь вам не нужно с linear…medium.com»

Что такое неконтролируемое обучение?

Вы помните тот день, когда вы отошли от компьютера, а когда вернулись, он узнал что-то новое? Ну, это неконтролируемое обучение… Шучу! Верно, компьютер?

В любом случае, мы говорили о неконтролируемом обучении. Которое, в отличие от обучения с учителем, не заботится о помеченных данных, оно ему не нужно.

Итак, если ему не нужны ярлыки, чтобы выполнять свою работу, как же работает неконтролируемое обучение? Отличный вопрос.

По сути, он использует очень умные алгоритмы для поиска скрытых шаблонов в данных без необходимости, чтобы надоедливый человек говорил ему, что искать, то есть ему не нужны никакие метки, поэтому он «неконтролируемый».

Алгоритмы, составляющие неконтролируемый инструментарий, выполняют одну из трех задач:

Кластеризация
Ассоциация
Снижение размерности

Можем ли мы их объединить? Войдите в полуконтролируемое обучение!

Представьте себе мир, в котором вы можете иметь все это, где вы можете иметь некоторые помеченные данные и при этом находить интересные идеи из большого набора данных. Войдите в полуконтролируемое обучение, где вы, по сути, сочетаете преимущества обоих, чтобы обеспечить прекрасную золотую середину функциональности.

Полууправляемое обучение отлично подходит, когда у вас есть небольшая часть ваших данных, которая была помечена, и вы хотите использовать эти метки в качестве своего рода дорожной карты для остальных прогнозов. Это очень полезно в области медицинской диагностики, где алгоритмы машинного обучения помогают рентгенологам читать медицинские изображения на наличие рака или других заболеваний.

Так что да, вы можете комбинировать два типа обучения, но, конечно, всегда есть компромисс, поэтому важно использовать наилучший метод для данных и задач, которые перед вами стоят.

Не могли бы вы опираться на это?

Конечно! На самом деле, теперь, когда вы упомянули о строительстве, есть еще один тип машинного обучения, о котором мы не говорили: обучение с подкреплением.

Обучение с подкреплением

Обучение с подкреплением — это третий основной класс алгоритмов машинного обучения, цель которого — найти золотую середину между исследованием данных, например обучением без учителя, и использованием этих знаний, например обучением с учителем. В отличие от обучения с учителем, для него не требуется помеченный набор данных, и, в отличие от обучения без учителя, оно не фокусируется исключительно на поиске шаблонов без предполагаемого применения. Вместо этого он стремится максимизировать функцию вознаграждения в долгосрочной перспективе, даже если это означает отрицательное вознаграждение, также известное как сожаление, в краткосрочной перспективе для общего положительного опыта.

Применение обучения с подкреплением включает:

Робототехника
Теория игры

Методы Монте-Карло — это известная группа алгоритмов в пространстве обучения с подкреплением, которые находят применение во многих областях исследований, включая физику элементарных частиц, вычислительную биологию, математику и оптимизацию, где они используются для моделирования данных с высокими уровнями размерности.

Где сейчас?

Если вы хотите узнать больше об алгоритмах, которые составляют как контролируемые, так и неконтролируемые алгоритмы, следите за обновлениями, так как я скоро добавлю больше материалов по этим темам.

Если вам нужен общий обзор науки о данных, посмотрите мой пост о преподавании науки о данных детям.

Наука о данных для детей. С чего начать
В последние годы область машинного обучения резко возросла, так почему бы не учить своего ребенка с помощью простых инструментов… allanbond.medium.com

Или, если вы хотите пост об обучении программированию с помощью Minecraft, то следующий пост для вас:

Обучение детей программированию с помощью Minecraft
Изучение программирования является почти обязательным требованием для наших детей, поскольку рабочая сила отходит от традиционных ролей и переходит к…allanbond.medium.com

Я надеюсь, что это краткое введение в мир машинного обучения дало вам некоторое представление о различиях между используемыми методами. Я стремлюсь предоставить простые для понимания схемы тем, связанных с машинным обучением, наукой о данных и программированием.

Если вам понравилась эта статья, свяжитесь со мной через LinkedIn или Twitter.