Машинное обучение, это слово стало горячей картошкой сейчас, я надеюсь, что большинство из вас слышали это слово много раз, но не знают, что именно? Итак, давайте посмотрим, что это такое.

Машинное обучение - это подмножество искусственного интеллекта (AI), которое дает системе возможность учиться и улучшаться автоматически на основе опыта без явного запрограммирован.

Машинное обучение часто является важным инструментом в работе с данными, особенно для составления прогнозов на основе данных.

Машинное обучение - это междисциплинарное сочетание статистики и информатики.

7 этапов жизненного цикла машинного обучения

  1. Сбор данных - сбор связанных данных.
  2. Подготовка данных - Организация собранных данных
  3. Data Wrangling - обнаружение и удаление шума, недопустимых данных, отсутствующих значений, повторяющихся значений из данных.
  4. Анализ данных - построение модели машинного обучения с использованием алгоритма машинного обучения.
  5. Обучение модели - обучите модель с помощью наборов данных, применяя различные алгоритмы машинного обучения.
  6. Тестовая модель - проверьте точность модели.
  7. Развертывание - Разверните модель в реальной системе.

Классификации машинного обучения

  1. Машинное обучение с учителем
  2. Неконтролируемое машинное обучение
  3. Машинное обучение с подкреплением

Машинное обучение с учителем

Алгоритмы контролируемого машинного обучения могут применять то, что они узнали из прошлых данных, к новым данным, используя помеченные примеры для прогнозирования будущих событий.

Проще говоря, контролируемый алгоритм машинного обучения обучается обучающим данным (помеченным). Т. Е. Он имеет значения x и соответствующие значения y. Алгоритм генерирует функцию, которая сопоставляет x с y и применяет ту же функцию к новым данным и предсказывает целевое значение.

Машинное обучение с учителем делится на 2 типа.

  1. Регресс
  2. Классификация

Регрессия: -. Регрессионный анализ - это метод прогнозного моделирования, который исследует взаимосвязь между зависимой и независимой переменной.

Алгоритмы регрессии классифицируются следующим образом:

  1. Линейная регрессия
  2. Полиномиальная регрессия
  3. Регрессия опорных векторов
  4. Хребтовая регрессия
  5. Лассо-регрессия

Линейная регрессия: линейная регрессия показывает линейную связь между независимой и зависимой переменной.

  • Если есть только одна входная переменная, это называется простой линейной регрессией. Если есть более одной входной переменной, это называется множественной линейной регрессией.

Математическое уравнение линейной регрессии.

Y= aX+b

Y = зависимая переменная - целевое значение

X = независимая переменная

a, b - линейные коэффициенты

Примеры: прогноз заработной платы, прогноз недвижимости и т. Д.,

Полиномиальная регрессия: -Для наборов данных, которые состоят из точек данных нелинейным образом, мы используем полиномиальную регрессию. В полиномиальной регрессии исходные характеристики преобразуются в полиномиальные характеристики заданных степени, а затем смоделированы с использованием линейной модели.

Математическое выражение полиномиальной регрессии.

Y = b0 + b1x + b2x2 + b3x3 +… .. + bnxn

Y = зависимая переменная - целевая переменная

x = независимая переменная

b0, b1, b2, b3, ……, bn - константы регрессии.

Поддержка векторной регрессии: это алгоритм регрессии, который работает для непрерывных переменных.

Основная цель регрессии опорных векторов - учесть максимальное количество точек данных в границах линий, а гиперплоскость (линия наилучшего соответствия) должна содержать максимальное количество точек данных.

Гребневая регрессия: если существует высокая коллинеарность между независимыми переменными, мы используем гребневую регрессию, чтобы уменьшить сложность модели. Это также называется Регуляризация L2. Риджерная регрессия - одна из самых надежных версий линейной регрессии, в которой вводится небольшое смещение, чтобы мы могли получать более точные долгосрочные прогнозы. Величина смещения, добавленная к модели, известна как штраф за гребневую регрессию .

Математическое выражение регрессии Риджа:

Регрессия лассо: также называется регуляризацией L1. Это похоже на регрессию Риджа, за исключением того, что штрафной член содержит только абсолютные веса, а не квадрат весов.

Математическое выражение для регрессии лассо:

Классификация.

Алгоритмы классификации классифицируются следующим образом:

  1. Логистическая регрессия
  2. Наивный байесовский
  3. K-ближайший сосед
  4. Древо решений
  5. Случайный лес

Логистическая регрессия: это алгоритм классификации в машинном обучении, который использует одну или несколько независимых переменных для определения целевых значений. Основная цель этого алгоритма - найти наиболее подходящую взаимосвязь между зависимым и множеством независимых переменных.

Примеры: прогноз погоды и т. Д.,

Наивный байесовский: - это алгоритм классификации, основанный на теореме Байеса. Наивный байесовский классификатор предполагает, что наличие определенной функции в классе не связано с наличием какой-либо другой функции в классе. Даже они зависят друг от друга, все эти свойства независимо вносят вклад в вероятность.

математическое представление:

K-ближайший сосед: контролируется и принимает набор помеченных точек и использует их для маркировки других точек. Чтобы пометить новую точку, он смотрит на метки ближайших соседей, подсчитывает метки разных типов и маркирует метку с наибольшим счетчиком для новой точки. «K» - это количество проверяемых соседей. На приведенном ниже графике, когда k = 3, количество классов -A равно 1, а количество классов-B равно 2, поэтому эта модель помечает новую точку как класс-B (2 ›1).

Регрессия дерева решений: - это классификатор древовидной структуры, он состоит из 2 узлов, называемых узлом решения и листовым узлом. Узлы решения используются для принятия решений и имеют несколько ветвей, и эти ветви представляют правила принятия решений, тогда как листовые узлы являются выходными узлами и не содержат дополнительных ветвей.

  • Это графическое представление для получения всех возможных решений проблемы / решения на основе заданных условий.

Регрессия случайного леса: - поскольку лес состоит из многих деревьев, СЛУЧАЙНЫЙ ЛЕС содержит несколько деревьев решений. Чем больше деревьев, тем выше точность и не возникает проблема чрезмерной подгонки.

Это все о введении в машинное обучение и машинное обучение с учителем. Давайте посмотрим, что такое машинное обучение без учителя и машинное обучение с подкреплением, в моих следующих статьях.

Спасибо, читатели, за то, что прочитали всю статью, это моя первая статья, поэтому я прошу вас всех высказать свое мнение в разделе комментариев, чтобы помочь мне стать лучше. Спасибо.