Введение в алгоритмы машинного обучения

Наивный байесовский алгоритм — это контролируемое обучение алгоритм, основанный на теореме Байеса,используемый в самых разных задач классификации в машинном обучении.

В этой статье я хотел бы дать вам подробное объяснение и то, как работает эта модель.

Что такое Наивный Байес?

Наивный байесовский классификатор используется в области контролируемого обучения и представляет собой алгоритм классификации при разработке быстрых моделей машинного обучения, которые могут делать точные прогнозы. Это вероятностный классификатор, поэтому он основывает свои прогнозы на вероятности того, что объект будет найден. Алгоритм наивного Байеса обычно используется для классификации текста, фильтрации спама и анализа настроений.

Что такое теорема Байеса?

Теорема Байеса — это простая формула, которую можно использовать для расчета условных вероятностей.
условная вероятность —мера возможности наступления события, если другое событие уже произошло, называется условной вероятностью. (по предположению, презумпции, утверждению или доказательствам).

Апостериорная вероятность (P(A|B)): вероятность гипотезы A относительно наблюдаемого события B.

Вероятность правдоподобия P(B|A): означает вероятность, то есть вероятность свидетельства при условии, что вероятность гипотезы верна.

Априорная вероятность (P(A)): вероятность гипотезы до того, как будут получены доказательства.
Предельная вероятность P(B):обозначает предельную вероятность вероятности доказательства.

Как работает наивный байесовский классификатор?

Допустим, у нас есть набор данных электронной почты и целевая переменная с именами «Спам» и «не спам». Итак, используя этот набор данных, мы должны выбрать, может ли письмо быть спамом или не спамом.

Преобразуйте данный набор данных в частотные таблицы.

  1. Найдите вероятность заданных функций, чтобы создать таблицу правдоподобия.
  2. Рассчитайте апостериорную вероятность, используя теорему Байеса.

Типы наивной байесовской модели

У нас есть 3 типа модели в Наивном Байесе

Гауссова

Модель Гаусса предполагает нормально распределенное распределение атрибутов. Если предикторы используют непрерывные значения, а не дискретные значения, модель предполагает, что непрерывные значения берутся из распределения Гаусса.

Многочлен

Классификатор Multinomial Nave Bayes используется, когда данные полиномиально распределены. В основном он используется для решения проблем с классификацией документов, например для определения того, к какой категории относится документ, например «Спорт», «Политика» или «Образование».

Бернулли

За исключением того, что переменные-предикторы в классификаторе Бернулли являются независимыми булевыми переменными, он подобен полиномиальному классификатору. Например, проверьте, используется ли слово в документе. Эта парадигма хорошо известна для задач, связанных с категоризацией документов.

Преимущества наивного байесовского классификатора:

  • Быстрая и простая стратегия машинного обучения для прогнозирования класса наборов данных — это байесовский метод.
  • Он превосходит другие алгоритмы при прогнозировании нескольких классов.
  • Это наиболее часто используемое решение для задач категоризации текста.

Если вам нравится моя статья и усилия сообщества, вы можете поддержать и поощрить меня, просто купив для меня кофе

Заключение

поэтому я надеюсь, что сегодня вы, ребята, хорошо понимаете, что в ближайшем будущем наивно-байесовский метод я буду делать больше статей, в которых я буду объяснять больше моделей и будет писать статью, чтобы внедритьнаивный байесовский методс исходным кодом.