Поймите разницу между основными понятиями в области машинного обучения.

Машинное обучение — это область искусственного интеллекта, которая создает алгоритмы, основанные на наборе примеров, и основная идея машинного обучения — обучение на примерах. Эти примеры могут быть взяты из природы, созданы людьми вручную или сгенерированы другим алгоритмом.

В этой статье мы объясним разницу между 5 основными понятиями в области машинного обучения:

  • Машинное обучение против традиционного программного обеспечения
  • Типы машинного обучения
  • Классификация против регрессии
  • Обучение на основе моделей и обучение на основе экземпляров
  • Мелкое и глубокое обучение

Машинное обучение и традиционное программное обеспечение

Мы можем обобщить разницу между традиционной программной системой и системой, основанной на машинном обучении, с помощью рисунков ниже.

В машинном обучении мы можем давать системе входные и выходные данные, а результатом является шаблон (код), который может преобразовывать входные данные в выходные. Тяжелая работа выполняется машиной, и нам просто нужно следить за процессом обучения, чтобы убедиться, что модель хороша.

С другой стороны, в традиционных системах сначала нужно самостоятельно найти шаблоны в данных, а затем написать код, который преобразует данные в желаемый результат, используя обнаруженные вручную шаблоны.

Типы систем машинного обучения

Системы машинного обучения можно классифицировать в зависимости от количества и типа контроля, который они получают во время обучения. Существует четыре основных категории: контролируемое обучение, неконтролируемое обучение, частично контролируемое обучение и обучение с подкреплением.

При обучении с учителем данные, которые вы передаете алгоритму, включают желаемые решения, называемые метками. Типичной задачей обучения с учителем является классификация, и спам-фильтр является хорошим примером, как показано на рисунке ниже.

При обучении без учителя данные не помечаются, и система пытается обучаться без учителя.

Некоторые алгоритмы могут работать с частично размеченными данными, обычно с большим количеством неразмеченных данных и небольшим количеством размеченных данных. Это называется полууправляемым обучением.

Обучение с подкреплением — это совсем другая система, в которой система обучения, называемая в данном контексте агентом, может наблюдать за окружающей средой, выбирать и выполнять действия и получать взамен вознаграждение (или штрафы в виде отрицательного вознаграждения). , как показано на рисунке ниже). Затем он должен сам узнать, какая стратегия, называемая политикой, является наилучшей, чтобы со временем получить наибольшую выгоду. Политика определяет, какое действие должен выбрать агент в той или иной ситуации.

Классификация и регрессия

В машинном обучении проблема классификации решается с помощью алгоритма обучения классификации, который принимает набор помеченных примеров в качестве входных данных и создает модель, которая может принимать немаркированный пример в качестве входных данных и либо напрямую выводить метку, либо выводить число, которое может быть использовано аналитиком данных для легкого определения метки.

В задаче классификации метка является членом конечного набора классов. Если размер набора классов равен двум, мы говорим о бинарной классификации (также называемой биномиальной). Мультиклассовая классификация (также называемая полиномиальной) — это задача классификации с тремя или более классами.

Регрессия — это проблема предсказания метки с действительным значением (часто называемой целью) на основе примера без метки. Проблема регрессии решается с помощью алгоритма обучения регрессии, который принимает набор помеченных примеров в качестве входных данных и создает модель, которая может принимать немаркированный пример в качестве входных данных и выводить цель.

Приведенная ниже блок-схема предназначена для того, чтобы дать пользователям приблизительное руководство о том, как подходить к проблемам, связанным с тем, какие оценки использовать для ваших данных.

Обучение на основе моделей и обучение на основе экземпляров

Большинство алгоритмов обучения с учителем основаны на моделях. Алгоритмы обучения на основе моделей используют обучающие данные для создания модели с параметрами, полученными из обучающих данных. После построения модели обучающие данные можно удалить.

Алгоритмы обучения на основе экземпляров используют в качестве модели весь набор данных. Одним из часто используемых на практике алгоритмов на основе экземпляров является k-Nearest Neighbours (kNN). В классификации, чтобы предсказать метку для входного примера, алгоритм kNN просматривает близкую окрестность входного примера в пространстве векторов признаков и выводит метку, которую он видел чаще всего в этой близкой окрестности.

Поверхностное и глубокое обучение

Алгоритм поверхностного обучения изучает параметры модели непосредственно из особенностей обучающих примеров. Большинство алгоритмов контролируемого обучения поверхностны.

Известными исключениями являются алгоритмы обучения нейронных сетей, особенно те, которые строят нейронные сети с более чем одним слоем между входом и выходом. Такие нейронные сети называются глубокими нейронными сетями.

При глубоком обучении нейронной сетиилиглубоком обучении, в отличие от поверхностного обучения, большинство параметров модели изучаются не непосредственно из особенностей обучающих примеров, а из выходных данных предыдущих слои.

Это все для этой статьи, спасибо за чтение! Вы можете связаться со мной в LinkedIn, используя следующую ссылку:

Ссылки

  • Григорьев, Алексей; Книжный лагерь по машинному обучению, Создайте портфолио реальных проектов, версия 10, издание MEAP, Manning, 2020.
  • Бурков, Андрей; Стостраничная книга по машинному обучению — черновик
  • Жерон, Орельен; Практическое машинное обучение с помощью Scikit-Learn, Keras и TensorFlow, O´Reilly, 2019.
  • Шпаргалка по алгоритму Sciki-learn, https://scikitlearn.org/stable/tutorial/machine_learning_map/index.html.