Здравствуйте и с возвращением! в предыдущей статье мы обсудили основы машинного обучения и его важность. Сегодня мы рассмотрим различные типы ML, вы уже видели различные типы ML в прошлой статье, и теперь мы обсудим их подробно.

Алгоритмы машинного обучения можно условно разделить на 4 основных типа:

  1. Контролируемое машинное обучение
  2. Неконтролируемое отмывание денег
  3. Частично контролируемое машинное обучение
  4. Обучение с подкреплением

Давайте обсудим один за другим подробно.

1. Контролируемое ОД:

Обучение с учителем — это тип машинного обучения, при котором алгоритм обучается на размеченном наборе данных. При обучении с учителем входные данные и соответствующие им выходные значения предоставляются алгоритму, и алгоритм учится сопоставлять входные данные с правильным выходным значением.

Обучение с учителем можно использовать для различных задач, таких как классификация и регрессия. При классификации алгоритм обучается предсказывать дискретный вывод, например, содержит ли изображение кошку или собаку. В регрессии алгоритм обучается прогнозировать непрерывный результат, например цену дома, на основе его характеристик.

Вы можете просто запомнить это: «Если набор данных имеет как входные, так и выходные данные, то это контролируемое машинное обучение».

Примечание. Дискретные данные — это числовой тип данных, который включает целые, конкретные числа с определенными и фиксированными значениями данных, определяемыми путем подсчета. Непрерывные данные включают комплексные числа и переменные значения данных, измеренные за определенный интервал времени.

Типы контролируемого отмывания денег

Опять же контролируемое ML делится на два типа:

  1. Регрессия.
  2. Классификация.

1] Регрессия:

Регрессия — это тип контролируемого алгоритма машинного обучения, используемый для прогнозирования числовых значений. Он включает в себя поиск взаимосвязи между зависимой переменной и одной или несколькими независимыми переменными.

В регрессии цель состоит в том, чтобы построить модель, которая может предсказать значение зависимой переменной на основе значений независимых переменных. Независимые переменные также известны как переменные-предикторы, а зависимая переменная — это прогнозируемая переменная.

Или просто: если выходной столбец представляет собой столбец числовых значений или если вы хотите предсказать числовое значение, то это регрессия.

Где мы используем регрессию?

Регрессия обычно используется в таких областях, как финансы, экономика, здравоохранение и многих других. Например, регрессионную модель можно использовать для прогнозирования продаж продукта на основе суммы, потраченной на рекламу, или для прогнозирования риска сердечных заболеваний на основе таких факторов, как возраст, пол и артериальное давление.

2] Классификация:

Классификация — это метод контролируемого машинного обучения, цель которого — предсказать категориальную метку класса нового экземпляра на основе прошлых наблюдений. Другими словами, это процесс определения, к какой из множества категорий относится новое наблюдение, на основе обучающих примеров известных категорий.

Пример: если у вас есть выходной столбец типа «Да» или «Нет», вы можете использовать эти данные. рассмотреть проблему классификации электронных писем как спам или не спам. Мы можем обучить модель классификации на наборе данных помеченных электронных писем, где каждое электронное письмо помечено как спам или не спам. Затем модель изучает шаблоны и отношения между функциями (например, словами, фразами, отправителем и т. д.) и соответствующими метками. При представлении нового, невидимого электронного письма модель будет предсказывать, является ли оно спамом или нет, на основе этих изученных шаблонов.

2. Неконтролируемое отмывание денег:

Неконтролируемое машинное обучение — это тип машинного обучения, который включает в себя обучающие модели для выявления закономерностей и взаимосвязей в данных без явных указаний или меток. Другими словами, вместо того, чтобы получать помеченные данные для обучения, неконтролируемые алгоритмы машинного обучения самостоятельно анализируют и выявляют закономерности в неразмеченных данных.

В простом ввод дается, а вывод не дается. Затем мы используем неконтролируемое машинное обучение.

Какова цель этого типа?

Целью неконтролируемого машинного обучения является обнаружение ранее неизвестных структур или взаимосвязей в данных, таких как кластеры, группы или аномалии. Этот тип машинного обучения особенно полезен при работе с большими объемами неструктурированных данных, таких как изображения, текст или данные датчиков.

Где мы используем этот тип?

Алгоритмы неконтролируемого машинного обучения обычно используются в широком спектре приложений, включая кластеризацию, обнаружение аномалий и уменьшение размерности. Выявляя закономерности и взаимосвязи в неразмеченных данных, неконтролируемое машинное обучение может помочь предприятиям и организациям получить новые сведения, улучшить процесс принятия решений и оптимизировать процессы.

Типы неконтролируемого ML

Опять же, у нас есть 4 различных типа неконтролируемого машинного обучения:

  1. Кластеризация.
  2. Уменьшение размерности
  3. Обнаружение аномалий.
  4. Ассоциативное изучение правил.

1] Кластеризация:

Кластеризация — это метод, при котором точки данных группируются вместе на основе их сходства. Цель состоит в том, чтобы разделить данные на группы или кластеры, чтобы точки данных внутри кластера были более похожи друг на друга, чем на точки данных в других кластерах.

На изображении ниже вы можете увидеть, как данные кластеризуются или группируются.

2] Уменьшение размерности:

Уменьшение размерности — это метод, используемый для уменьшения количества объектов или переменных в наборе данных. Целью уменьшения размерности является упрощение набора данных при сохранении как можно большего количества информации.

Во многих случаях наборы данных могут содержать большое количество нерелевантных, избыточных или зашумленных функций, что может затруднить анализ данных или построение моделей. Уменьшение размерности может помочь устранить эти особенности и уменьшить сложность набора данных, упрощая работу с ним и обеспечивая более точный анализ и моделирование.

Существует два основных типа методов уменьшения размерности:

  1. Выбор функций: при выборе функций подмножество исходных функций выбирается на основе некоторого критерия. Этот метод отбрасывает нерелевантные и избыточные функции из набора данных.
  2. Извлечение признаков: при извлечении признаков создается новый набор признаков, который обобщает информацию, содержащуюся в исходных признаках. Этот метод преобразует набор данных в пространство меньшего размера, в котором сохраняются наиболее важные и информативные функции.

3] Обнаружение аномалий:

Обнаружение аномалий — обычная задача неконтролируемого машинного обучения, которая включает в себя идентификацию точек данных, которые значительно отличаются от большинства данных. Обнаружение аномалий можно использовать для широкого спектра приложений, таких как обнаружение мошенничества, обнаружение сетевых вторжений и прогнозирование отказов оборудования.

Короче говоря, найти выбросы.

4] Изучение ассоциативных правил:

Ассоциативное обучение правилам — это метод неконтролируемого машинного обучения, который выявляет интересные отношения или ассоциации между переменными в больших наборах данных. Он также известен как анализ ассоциативных правил или анализ рыночной корзины. Целью изучения ассоциативных правил является обнаружение интересных закономерностей, корреляций и взаимосвязей в данных без каких-либо предварительных знаний или предположений о переменных.

В этом методе алгоритм ищет часто встречающиеся наборы элементов, которые представляют собой группы элементов, которые часто встречаются вместе в наборе данных. Затем эти наборы элементов используются для создания правил, описывающих отношения между переменными. Правила выражаются в форме утверждений «если-то», где антецедент (часть «если») представляет собой условие или критерий, а консеквент (часть «тогда») представляет исход или результат.

Например, правило, сгенерированное алгоритмом, может быть таким: «Если клиент покупает хлеб и молоко, он, скорее всего, купит яйца». Это правило можно использовать для рекомендаций покупателям, например, предлагать им покупать яйца при покупке хлеба и молока.

3. Полуприсмотр

Обучение с полуучителем — это тип машинного обучения, при котором алгоритм обучается с использованием как размеченных, так и неразмеченных данных. В традиционном обучении с учителем все данные помечены, что означает, что каждая точка данных имеет соответствующее выходное или целевое значение. Однако при полууправляемом обучении помечается только подмножество данных, и алгоритм должен использовать информацию как из помеченных, так и из немаркированных данных, чтобы делать прогнозы.

Некоторые распространенные приложения полуконтролируемого обучения включают обработку естественного языка, компьютерное зрение и распознавание речи. В этих областях часто трудно или нецелесообразно маркировать большие объемы данных, но по-прежнему доступно большое количество немаркированных данных. Полууправляемое обучение может помочь использовать эти немаркированные данные и повысить производительность моделей машинного обучения.
4. Подкрепление
Обучение с подкреплением (RL) — это тип машинного обучения, направленный на обучение агента принятию решений на основе его окружения. В RL агент взаимодействует с окружающей средой и получает обратную связь в виде вознаграждений или наказаний в зависимости от своих действий. Цель агента — изучить политику, которая максимизирует его кумулятивное вознаграждение с течением времени.

Обучение с подкреплением часто используется в сценариях, где нет доступных размеченных данных, и агент должен учиться методом проб и ошибок. Примеры приложений RL включают игровых агентов, робототехнику и автономные транспортные средства. RL также используется в рекомендательных системах и онлайн-рекламе для оптимизации вовлеченности пользователей и коэффициентов конверсии.

Мы рассмотрели четыре основных типа машинного обучения, в том числе контролируемое обучение, неконтролируемое обучение, частично контролируемое обучение и обучение с подкреплением. Каждый из этих типов имеет свои уникальные преимущества и ограничения, а также практическое применение в различных областях. Понимая эти типы машинного обучения, мы можем выбрать правильный алгоритм для поставленной задачи и добиться более точных и эффективных результатов. По мере того, как машинное обучение продолжает развиваться, оно открывает новые возможности для инноваций и открытий в различных отраслях. Итак, давайте продолжать исследовать и учиться вместе, так как в захватывающем мире машинного обучения еще так много открытий!

……………………………………ПРОДОЛЖЕНИЕ СЛЕДУЕТ………………………………..

Спасибо, что прочитали сегодняшнюю статью о типах машинного обучения. Я надеюсь, что это помогло вам лучше понять различные типы машинного обучения и их приложения. Я призываю вас к дальнейшему изучению этих типов, чтобы улучшить свои знания.

Двигаясь вперед, в нашей следующей статье мы углубимся в проблемы, с которыми сталкивается ML, и шаги, необходимые для их решения. Это позволит нам лучше понять процесс, связанный с решением проблем ML. Благодарим вас за постоянный интерес к нашим статьям.

Продолжайте учиться…….🖤

ВСЕ ЛЮБЯТ БЕЗ НЕНАВИСТИ 🖤

Спасибо……