Машинное обучение, это слово стало горячей картошкой сейчас, я надеюсь, что большинство из вас слышали это слово много раз, но не знают, что именно? Итак, давайте посмотрим, что это такое.
Машинное обучение - это подмножество искусственного интеллекта (AI), которое дает системе возможность учиться и улучшаться автоматически на основе опыта без явного запрограммирован.
Машинное обучение часто является важным инструментом в работе с данными, особенно для составления прогнозов на основе данных.
Машинное обучение - это междисциплинарное сочетание статистики и информатики.
7 этапов жизненного цикла машинного обучения
- Сбор данных - сбор связанных данных.
- Подготовка данных - Организация собранных данных
- Data Wrangling - обнаружение и удаление шума, недопустимых данных, отсутствующих значений, повторяющихся значений из данных.
- Анализ данных - построение модели машинного обучения с использованием алгоритма машинного обучения.
- Обучение модели - обучите модель с помощью наборов данных, применяя различные алгоритмы машинного обучения.
- Тестовая модель - проверьте точность модели.
- Развертывание - Разверните модель в реальной системе.
Классификации машинного обучения
- Машинное обучение с учителем
- Неконтролируемое машинное обучение
- Машинное обучение с подкреплением
Машинное обучение с учителем
Алгоритмы контролируемого машинного обучения могут применять то, что они узнали из прошлых данных, к новым данным, используя помеченные примеры для прогнозирования будущих событий.
Проще говоря, контролируемый алгоритм машинного обучения обучается обучающим данным (помеченным). Т. Е. Он имеет значения x и соответствующие значения y. Алгоритм генерирует функцию, которая сопоставляет x с y и применяет ту же функцию к новым данным и предсказывает целевое значение.
Машинное обучение с учителем делится на 2 типа.
- Регресс
- Классификация
Регрессия: -. Регрессионный анализ - это метод прогнозного моделирования, который исследует взаимосвязь между зависимой и независимой переменной.
Алгоритмы регрессии классифицируются следующим образом:
- Линейная регрессия
- Полиномиальная регрессия
- Регрессия опорных векторов
- Хребтовая регрессия
- Лассо-регрессия
Линейная регрессия: линейная регрессия показывает линейную связь между независимой и зависимой переменной.
- Если есть только одна входная переменная, это называется простой линейной регрессией. Если есть более одной входной переменной, это называется множественной линейной регрессией.
Математическое уравнение линейной регрессии.
Y= aX+b
Y = зависимая переменная - целевое значение
X = независимая переменная
a, b - линейные коэффициенты
Примеры: прогноз заработной платы, прогноз недвижимости и т. Д.,
Полиномиальная регрессия: -Для наборов данных, которые состоят из точек данных нелинейным образом, мы используем полиномиальную регрессию. В полиномиальной регрессии исходные характеристики преобразуются в полиномиальные характеристики заданных степени, а затем смоделированы с использованием линейной модели.
Математическое выражение полиномиальной регрессии.
Y = b0 + b1x + b2x2 + b3x3 +… .. + bnxn
Y = зависимая переменная - целевая переменная
x = независимая переменная
b0, b1, b2, b3, ……, bn - константы регрессии.
Поддержка векторной регрессии: это алгоритм регрессии, который работает для непрерывных переменных.
Основная цель регрессии опорных векторов - учесть максимальное количество точек данных в границах линий, а гиперплоскость (линия наилучшего соответствия) должна содержать максимальное количество точек данных.
Гребневая регрессия: если существует высокая коллинеарность между независимыми переменными, мы используем гребневую регрессию, чтобы уменьшить сложность модели. Это также называется Регуляризация L2. Риджерная регрессия - одна из самых надежных версий линейной регрессии, в которой вводится небольшое смещение, чтобы мы могли получать более точные долгосрочные прогнозы. Величина смещения, добавленная к модели, известна как штраф за гребневую регрессию .
Математическое выражение регрессии Риджа:
Регрессия лассо: также называется регуляризацией L1. Это похоже на регрессию Риджа, за исключением того, что штрафной член содержит только абсолютные веса, а не квадрат весов.
Математическое выражение для регрессии лассо:
Классификация.
Алгоритмы классификации классифицируются следующим образом:
- Логистическая регрессия
- Наивный байесовский
- K-ближайший сосед
- Древо решений
- Случайный лес
Логистическая регрессия: это алгоритм классификации в машинном обучении, который использует одну или несколько независимых переменных для определения целевых значений. Основная цель этого алгоритма - найти наиболее подходящую взаимосвязь между зависимым и множеством независимых переменных.
Примеры: прогноз погоды и т. Д.,
Наивный байесовский: - это алгоритм классификации, основанный на теореме Байеса. Наивный байесовский классификатор предполагает, что наличие определенной функции в классе не связано с наличием какой-либо другой функции в классе. Даже они зависят друг от друга, все эти свойства независимо вносят вклад в вероятность.
математическое представление:
K-ближайший сосед: контролируется и принимает набор помеченных точек и использует их для маркировки других точек. Чтобы пометить новую точку, он смотрит на метки ближайших соседей, подсчитывает метки разных типов и маркирует метку с наибольшим счетчиком для новой точки. «K» - это количество проверяемых соседей. На приведенном ниже графике, когда k = 3, количество классов -A равно 1, а количество классов-B равно 2, поэтому эта модель помечает новую точку как класс-B (2 ›1).
Регрессия дерева решений: - это классификатор древовидной структуры, он состоит из 2 узлов, называемых узлом решения и листовым узлом. Узлы решения используются для принятия решений и имеют несколько ветвей, и эти ветви представляют правила принятия решений, тогда как листовые узлы являются выходными узлами и не содержат дополнительных ветвей.
- Это графическое представление для получения всех возможных решений проблемы / решения на основе заданных условий.
Регрессия случайного леса: - поскольку лес состоит из многих деревьев, СЛУЧАЙНЫЙ ЛЕС содержит несколько деревьев решений. Чем больше деревьев, тем выше точность и не возникает проблема чрезмерной подгонки.
Это все о введении в машинное обучение и машинное обучение с учителем. Давайте посмотрим, что такое машинное обучение без учителя и машинное обучение с подкреплением, в моих следующих статьях.
Спасибо, читатели, за то, что прочитали всю статью, это моя первая статья, поэтому я прошу вас всех высказать свое мнение в разделе комментариев, чтобы помочь мне стать лучше. Спасибо.