Изучите широкие категории, которые помогают классифицировать алгоритмы машинного обучения.

Существует так много различных типов алгоритмов ML. Следовательно, становится легче классифицировать их на основе некоторых критериев для облегчения понимания.

Три основных критерия, которые разумно используются для классификации всех алгоритмов машинного обучения, следующие:
• Обучаются под наблюдением человека (Обучение с учителем, Неконтролируемое, Полууправляемое и Обучение с подкреплением)
Могут ли они учиться на лету (Онлайн-обучение и пакетное обучение)
• Могут ли они работать, сравнивая новые точки данных с известными точками данных, или они обнаруживают закономерности в обучающих данных и строят прогностическую модель? (Обучение на основе примеров и обучение на основе моделей)

1. Алгоритм контролируемого машинного обучения

  • Обучающий набор, который вы передаете алгоритму, включает нужные решения, называемые ярлыками.

  • Типичная задача контролируемого обучения называется Классификация. Это помогает классифицировать данные по отдельным классам. Логистическая регрессия обычно используется для классификации. Он выводит значение, которое соответствует вероятности того, что значение принадлежит данному классу.
  • Другая задача контролируемого обучения состоит в том, чтобы предсказать целевое значение или числовое значение, такое как цена автомобиля, с учетом набора характеристик (пробег, возраст, марка и т. д.), которые известны как предикторы. Такая задача называется регрессией.

2. Алгоритм машинного обучения без учителя

  • Данные обучения не помечены, и система пытается изучить/классифицировать значения без учителя.

  • Алгоритмы кластеризации. Они помогают обнаруживать похожие группы данных. Допустим, у вас есть много данных о посетителях вашего блога. Этот алгоритм самостоятельно изучает связи между группами посетителей. Используя Алгоритмы иерархической кластеризации (HCA), вы можете разделить каждую группу на более мелкие группы, что поможет ориентировать ваши сообщения для каждой группы.
  • Визуализация и уменьшение размерности. В алгоритмах визуализации вы передаете алгоритму множество сложных немаркированных данных, и они выводят 2D- или 3D-представление ваших данных, которое можно легко построен. Эти алгоритмы пытаются сохранить как можно больше структуры. Уменьшение размерности — это упрощение данных без потери слишком большого количества информации. Это помогает объединить несколько взаимосвязанных функций в одну. Скажем, пробег автомобиля сильно коррелирует с его возрастом, поэтому алгоритм уменьшения размерности объединяет их в одну характеристику, отражающую износ автомобиля. Это называется извлечение признаков.
  • Обнаружение аномалий и новинок. Обнаружение аномалий помогает обнаруживать необычные транзакции по кредитным картам, выявлять производственные дефекты, автоматически удалять выбросы из набора данных и т. д. обучающий набор, поэтому он учится легко их распознавать. Таким образом, когда он видит новый экземпляр, он может определить, является ли он нормальным или аномальным. Обнаружение новизны направлено на обнаружение новых экземпляров, которые отличаются от всех экземпляров в обучающем наборе. Для этого требуется очень чистый обучающий набор, лишенный каких-либо экземпляров, которые вы хотите, чтобы алгоритм обнаружил. Скажем, у вас есть тысячи фотографий собак, и только 1% из них представляет золотистых ретриверов. Алгоритм обнаружения новинок не должен рассматривать новые изображения золотистых ретриверов как новинки. С другой стороны, обнаружение аномалий классифицирует золотистых ретриверов как аномалии.
  • Изучение правил ассоциации. Цель состоит в том, чтобы изучить большие объемы данных и обнаружить интересные взаимосвязи между атрибутами.

3. Полууправляемый алгоритм машинного обучения

Эта система работает с частично помеченными данными. Маркировка данных обычно требует очень много времени и денег, поэтому экономичнее иметь несколько экземпляров с метками и несколько экземпляров без меток. Google Фото — отличный пример. Как только вы загрузите все свои семейные фотографии, он автоматически распознает фотографии с одним и тем же человеком. Это неконтролируемая часть алгоритма (кластеризация). Как только система разделит всех уникальных людей на всех фотографиях, она попросит вас добавить по одной метке для каждого человека. Это контролируемая часть алгоритма.

Например, Сети глубокого доверия (DBN) основаны на неконтролируемых компонентах, называемых Ограниченными машинами Больцмана (RBM), расположенных друг над другом. RBM последовательно обучаются без учителя, а затем вся система настраивается с использованием методов обучения с учителем.

4. Алгоритм машинного обучения с подкреплением

Система обучения, называемая Агент, может наблюдать за окружающей средой, выбирать и выполнять действия, а взамен получать Награды или получать Наказания в форме отрицательных вознаграждений. Затем он должен самостоятельно изучить наилучшую стратегию, называемую политикой, чтобы со временем получать наибольшую награду. Политика определяет, какое действие должен выбрать агент в той или иной ситуации.

1. Пакетное обучение

Система не способна обучаться постепенно. Его необходимо обучать, используя все доступные данные. Обычно это занимает много времени и вычислительных ресурсов, поэтому обычно выполняется в автономном режиме. Сначала система обучается, потом запускается в продакшн и дальше работает без обучения. Он применяет то, что только что узнал. Это также называется офлайн-обучением. Если эта система должна быть обучена любым новым данным, вам необходимо обучить новую версию системы с нуля на полном наборе данных, затем остановить старую/предыдущую систему и заменить ее новой. Если системе необходимо адаптироваться к быстро меняющимся данным, необходимо более быстрое решение. Этот процесс использует много вычислительных ресурсов (ЦП, объем памяти, дисковое пространство, дисковый ввод-вывод, сетевой ввод-вывод и т. д.) и не способен к автономному обучению.

2. Онлайн-обучение

Эту систему можно обучать постепенно, последовательно загружая экземпляры данных либо индивидуально, либо небольшими группами, называемыми мини-пакетами. Каждый шаг обучения является быстрым и дешевым, поэтому система может легко узнавать о новых данных на лету. Эта система отлично подходит для систем, которые получают данные в виде непрерывного потока (например, цены на акции) и должны адаптироваться к быстрым или автономным изменениям. Эта система также является хорошим вариантом, если у вас ограниченные ресурсы для обучения, поскольку после того, как система будет обучена новым данным, она больше не нуждается в них и может быть отброшена. Это может сэкономить большое количество места. Алгоритмы онлайн-обучения также можно использовать для обучения систем на огромных наборах данных, которые не помещаются в основную память одной машины. Это называется нестандартным обучением. Обычно это делается в автономном режиме, как и при поэтапном обучении. Алгоритм загружает часть данных, выполняет этап обучения этих данных и повторяет процесс, пока не обработает все свои данные.

Одним из важных параметров онлайн-обучения является скорость адаптации к изменяющимся данным: это называется скорость обучения. Если вы установите высокую скорость обучения, ваша система будет быстро адаптироваться к новым данным, но она также будет склонна быстро забывать старые данные. Если вы установите низкую скорость обучения, система будет иметь большую инерцию, следовательно, она будет обучаться медленнее и будет менее эффективна в отношении шума в новых данных или выбросов.

Основным недостатком онлайн-обучения является то, что если в систему поступают неверные данные, производительность системы будет постепенно снижаться.

1. Обучение на основе примеров

Это самая тривиальная форма обучения/обобщения — просто заучивание наизусть. Если бы вы создали спам-фильтр таким образом, он просто помечал бы все электронные письма, идентичные электронным письмам, которые уже были помечены. Вместо того, чтобы помечать только идентичные электронные письма со спамом, спам-фильтр можно запрограммировать так, чтобы он также помечал электронные письма, которые очень похожи на известные электронные письма со спамом. Для этого требуется мера сходства между двумя электронными письмами. Очень простой мерой сходства между двумя электронными письмами может быть подсчет количества общих слов в них.

Это называется обучением на основе экземпляров. Система запоминает примеры наизусть, а затем обобщает новые случаи, используя меру сходства, чтобы сравнить их с выученными примерами.

2. Обучение на основе моделей

Другой формой обобщения является построение модели из этих примеров, а затем использование этой модели для прогнозирования. Это называется обучением на основе моделей.

В этом методе вы изучаете данные и выбираете модель. Затем обучите модель на обучающих данных. Применяйте различные алгоритмы машинного обучения, чтобы оценить разницу в производительности, а затем выберите лучшую модель. Наконец, примените модель, чтобы делать прогнозы для новых случаев. Это называется выводом.