Машинное обучение: краткое введение

Машинное обучение — это область исследования, которая дает компьютеру возможность учиться без явного программирования (Артур Самуэль, 1959). В нашей повседневной жизни мы очень часто сталкиваемся с машинным обучением. Алгоритмы машинного обучения существуют уже давно, но недавний рост быстрых компьютерных вычислений и доступных хранилищ превратил их в реальность. Несколько примеров, как показано ниже

Онлайн-рекомендация от Netflix и Amazon на основе нашей истории с этими веб-сайтами.
Система обнаружения мошенничества в банке и т.д.

Чем машинное обучение отличается от классического программирования

В классическом программировании вы вводите правила (программу) и данные, которые будут обрабатываться на основе введенного правила. Вы получаете ответы на выходе. В машинном обучении вы вводите данные, а также ответы и получаете правила в качестве результата. Затем эти правила можно применять к новым данным для прогнозирования или классификации. Вместо явного программирования вы обучаете систему машинному обучению.

Типы машинного обучения

Контролируемое обучение

В контролируемом обучении вы обучаете машину, используя хорошо "маркированные данные.

Машинное обучение с учителем включает в себя два основных процесса: классификацию и регрессию.

Классификация — это процесс, при котором входящие данные маркируются на основе прошлых выборок данных и вручную обучают алгоритм распознаванию определенных типов объектов и их соответствующей классификации. Система должна уметь различать типы информации, выполнять оптическое распознавание символов, изображений или двоичных кодов.
Регрессия — это процесс выявления закономерностей и расчета прогнозов непрерывных результатов.
Примерами являются линейная регрессия, логистическая регрессия, случайный лес, деревья решений, наивный байесовский метод, ближайший сосед.

Обучение без учителя

В отличие от обучения с учителем, оно работает с неразмеченными данными, которые алгоритм пытается понять, самостоятельно извлекая признаки и закономерности.

Алгоритмы обучения без учителя используют следующие методы для описания данных:

Кластеризация: это исследование данных, используемое для сегментации их на кластеры на основе их внутренних шаблонов без предварительного знания учетных данных группы. Учетные данные определяются сходством отдельных объектов данных, а также аспектами их отличия от остальных (что также можно использовать для обнаружения аномалий).
Снижение размерности: в поступающих данных много шума. Алгоритмы машинного обучения используют уменьшение размерности, чтобы удалить этот шум при извлечении соответствующей информации.
Примерами неконтролируемых алгоритмов являются кластеризация k-средних, t-SNE (встраивание t-распределенных стохастических соседей), PCA (анализ основных компонентов).

Обучение с подкреплением

В усиленном машинном обучении используется метод, называемый исследованием/эксплуатацией. Механика проста — действие происходит, последствия наблюдаются, а следующее действие учитывает результаты первого действия.

Два основных типа сигналов вознаграждения:

Положительный сигнал вознаграждения побуждает продолжать выполнение определенной последовательности действий.
Сигнал отрицательного вознаграждения наказывает за определенные действия и призывает исправить алгоритм, чтобы прекратить получение штрафов.

Наиболее распространенные алгоритмы обучения с подкреплением включают в себя: Q-Learning, Temporal Difference (TD), поиск по дереву Монте-Карло (MCTS).

Применения машинного обучения

Финансовая служба

Машинное обучение — быстрорастущая тенденция в финансовой индустрии. Он использовался для двух основных целей: обнаружения мошенничества и получения значимого понимания данных для выявления инвестиционных возможностей.

Рекомендации по продуктам

Машинное обучение широко используется различными компаниями электронной коммерции и развлечений, такими как Amazon, Netflix и т. д., для рекомендации продукта пользователю. Всякий раз, когда мы ищем продукт на Amazon, мы начинаем получать рекламу одного и того же продукта во время интернет-серфинга в том же браузере, и это связано с машинным обучением.

Google понимает интерес пользователя с помощью различных алгоритмов машинного обучения и предлагает продукт в соответствии с интересами заказчика.

Автономные автомобили

Одно из самых захватывающих применений машинного обучения — беспилотные автомобили. Машинное обучение играет важную роль в беспилотных автомобилях. Tesla, самая популярная компания по производству автомобилей, работает над беспилотным автомобилем. Он использует метод неконтролируемого обучения для обучения моделей автомобилей обнаружению людей и объектов во время вождения.

Фильтрация спама и вредоносных программ в электронной почте

Всякий раз, когда мы получаем новое электронное письмо, оно автоматически фильтруется как важное, обычное и спам. Мы всегда получаем важное письмо в наш почтовый ящик с важным символом и спамом в нашем ящике для спама, и технология, стоящая за этим, — машинное обучение. Ниже приведены некоторые спам-фильтры, используемые Gmail:

Фильтр контента
Фильтр заголовков
Общий фильтр черных списков
Фильтры на основе правил
Фильтры разрешений

Здравоохранение

В медицине машинное обучение используется для диагностики заболеваний. При этом медицинские технологии развиваются очень быстро и способны создавать 3D-модели, которые могут предсказать точное положение поражений в мозге.

Ссылки

Машинное обучение: краткое введение

Типы машинного обучения

Применения машинного обучения

Вопросы по теме