Когда использовать контролируемое и неконтролируемое обучение

Контролируемое обучение

Вспомните, когда вы были маленьким ребенком и впервые изучали цвета. Если бы кто-то указал на зеленую стену и спросил вас, какого она цвета, вы бы понятия не имели! Но затем приходит твоя мама и начинает учить тебя цветам, указывая на предметы и повторяя «Это красное», «Это синее» снова и снова. Увидев множество примеров цветных предметов и научившись маме правильному использованию цветов, вы начинаете распознавать закономерности — зеленые вещи обычно выглядят именно так! Красные вещи имеют тенденцию выглядеть именно так! Как только вы освоитесь, мама проверяет вас, указывая на случайный предмет и спрашивая, какого он цвета. Если вы поняли это правильно, вы научились! Именно так работает контролируемый подход машинного обучения.

Весь этот процесс — то, как обучаются контролируемые алгоритмы машинного обучения. Алгоритму дается множество помеченных обучающих примеров, например, ваша мама указывает на зеленый и красный. Он находит закономерности в этих помеченных данных, чтобы изучить модель, которая может точно предсказать метки для новых невидимых данных, точно так же, как вы научились маркировать новые цвета. Метки обеспечивают контроль над алгоритмом, обучая его правильным выводам для заданных входов. Обучение с учителем — это изучение правил на размеченных примерах, которые можно обобщить для прогнозирования новых данных!

Обучение без присмотра

Представьте, что вы только что перешли в новую школу. Очевидно, вы никого не знаете, но хотите подружиться. В первый день вы разговариваете и наблюдаете, как формируются разные группы по интересам и личностям — спортсмены, художники и компьютерные фанаты. Вы самостоятельно определяете социальные кластеры и то, куда вы можете вписаться, основываясь на подобранных вами шаблонах. Никто не сказал вам подробно, какие группы существуют, но вы использовали наблюдения, чтобы изучить основную социальную структуру. Вот как работает подход машинного обучения без учителя!

С технической точки зрения, алгоритмы машинного обучения без присмотра получают данные, которые не помечены. Им приходится самостоятельно изучать тенденции и закономерности.

Обучение с учителем и без учителя

Подводя итог, можно сказать, что тип используемого вами подхода к машинному обучению зависит от того, какие данные у вас есть и что вы хотите с ними делать.

Обучение под присмотром лучше всего, когда вы помечаете данные, как на примерах, которые наши мамы использовали, чтобы учить нас цветам. Метки позволяют алгоритму изучить модель, которая может прогнозировать результаты для новых данных. Используйте обучение с учителем, когда вам нужно, чтобы ваш алгоритм мог точно классифицировать новые примеры или делать числовые прогнозы.

Напротив, обучение без учителя становится лучше, когда у вас есть только неразмеченные данные. Алгоритму приходится самостоятельно находить скрытые закономерности и группировки, точно так же, как мы наблюдали социальные кластеры в новой школе. Используйте обучение без учителя, чтобы получать новую информацию о сложных данных, сегментировать клиентов или выявлять аномалии.

Размеченные данные? Иди под наблюдением. Немаркированные данные? Оставайтесь без присмотра.

Я надеюсь, что благодаря этим аналогиям вам было легче и интереснее изучать эту тему. Дайте мне знать, если у вас есть другие забавные аналогии!