Измененный отрывок из моего доклада на семинаре.

В принципе, машинное обучение (ML) описывает процесс создания точных прогнозов на основе исторической информации, доступной для модели. Информация должна быть закодирована таким образом, чтобы модель могла ее обрабатывать и, следовательно, учиться на ней [9]. Обучение в этом контексте означает поиск значимого соответствия между входными и выходными данными.
Прежде чем мы углубимся в машинное обучение, давайте взглянем на его контекст в более широкой области ИИ. Хотя глубокое обучение (ГО) является наиболее известным и, безусловно, наиболее разрекламированным подмножеством, это всего лишь один из методов МО, который, в свою очередь, является частью более широкой области ИИ.

DL описывает алгоритмы нейронной сети, которые сами изучают соответствующие функции обучающих данных. ML также включает в себя методы, которые используют извлеченные человеком функции в обучающих данных для обучения. Он описывает все системы, которые используют большие объемы данных для самостоятельного обучения. Искусственный
интеллект, с другой стороны, охватывает все системы, которые пытаются имитировать человеческое поведение, включая методы, работающие с жестко запрограммированным набором правил [10].

Общие учебные задачи и проблемы

Прежде чем мы более подробно рассмотрим конкретные методы, давайте рассмотрим общие проблемы, которые можно решить с помощью ML.

  • Классификация. Проблема присвоения категории каждому элементу в группе. Например, пометка самого заметного объекта на изображении или категоризация текстовых документов по тематическим группам, таким как политика, экономика, погода, или просто определение положительного или отрицательного отзыва.
  • Регрессия: прогнозирование развития
    входных данных, а не присвоение метки. В отличие от
    задач классификации, входные данные находятся в замкнутом
    контексте, например, временной ряд. Модель может научиться
    предсказывать, например, динамику цен на жилье
    в конкретном районе с учетом прошлых данных или температуру
    завтра с учетом метеорологических данных.
  • Рейтинг: научиться упорядочивать элементы в заданном наборе на основе
    сложных критериев, например, чтобы определить,
    какие рекламные объявления показывать пользователю на основе их
    прошлое поведение.
  • Кластеризация: группировка набора данных в различные однородные
    подмножества на основе некоторого показателя сходства. Примером
    может быть задача сегментации изображения на передний план
    и фон.
  • Уменьшение размерности. Эта задача часто выполняется
    перед передачей данных в нейронную сеть. Его цель состоит в том, чтобы
    уменьшить размер входных данных, сохранив при этом функции,
    важные для задачи, тем самым облегчив изучение модели
    [9].
  • Генеративные модели. Задача создания новых выборок данных, которые аналогичны имеющимся данным. Сюда входит
    создание новых изображений или обработка изображений определенным образом
    .

Методы машинного обучения

Общие методы машинного обучения, которые используются для решения этих проблем, следующие:

  • Обучение с учителем. Это наиболее распространенная форма машинного обучения, и чаще всего именно ее имеют в виду, когда говорят об искусственном интеллекте или машинном обучении. Учащийся получает аннотированные входные данные, и его задача состоит в том, чтобы изучить сопоставление между входными данными и аннотацией. Примером может служить обучение классификации изображений из помеченного
    набора данных изображений.
  • Обучение без учителя. Учащийся получает немаркированный набор данных. Цель состоит в том, чтобы найти интересные корреляции или полезные преобразования в данных. Высокоразмерные входные данные могут быть уменьшены до более низких размерностей, сохраняя при этом соответствующую информацию. Это упрощает визуализацию данных или поиск кластеров в наборе данных.
  • Обучение с подкреплением. В этом сценарии учащийся называется агентом. Агент живет в среде и получает информацию о ней. Его задача — максимизировать некоторое вознаграждение, взаимодействуя с его окружением. За каждое действие он получает немедленное вознаграждение или штраф. Такой подход успешно используется в моделях обучения игре в игровые игры, такие как Artari [11] или Go.
  • Обучение в ансамбле: это комбинация нескольких учащихся, которые формируют еще одного надежного ученика. Обычно каждый учащийся обучается на одном и том же наборе данных с использованием другого алгоритма или немного разных гиперпараметров.
    Поскольку разные алгоритмы извлекают разные функции,
    их комбинация часто приводит к повышению общей производительности [9,
    стр. 6–7], [12, стр. 94–95].

Теперь у вас есть общее представление о том, что включает в себя область ML и какие проблемы она решает. Следующим шагом будет изучение конкретных алгоритмов, таких как регрессия, случайные леса, машины опорных векторов или нейронные сети.

Чтобы начать работу с практическим машинным обучением и, в частности, с нейронными сетями, я бы порекомендовал книгу «Глубокое обучение с помощью Python» Ф. Шолле.

References:
[9] M. Mohri, A. Rostamizadeh, and A. Talwalkar, Foundations of machine
learning. MIT press, 2018.
[10] “IBM, Rodrigo Ceron ai, machine learning and deep learning: What’s the
difference?” https://www.ibm.com/blogs/systems/ ai-machine-learningand-deep-learning-whats-the-difference/, accessed: 2020-11-20.
[11] V. Mnih, K. Kavukcuoglu, D. Silver, A. Graves, I. Antonoglou, D. Wierstra, and M. Riedmiller, “Playing atari with deep reinforcement learning,” arXiv preprint arXiv:1312.5602, 2013.
[12] F. Chollet et al., “Keras: The python deep learning library,” ascl, pp.
ascl–1806, 2018.