5 алгоритмов машинного обучения, которые вы должны знать

Мы предвещаем новый рассвет с 2020 годом — миром, в котором нейронные сети, глубокое обучение и НЛП быстро становятся конкурентными преимуществами. Компании по всему миру с удовольствием осваивают технологии машинного обучения. Поэтому неудивительно, что Boston Consulting Group прогнозирует 25% потери рабочих мест из-за алгоритмов машинного обучения и автоматизации.

Хотя данные необходимы для решений машинного обучения, алгоритм, лежащий в их основе, не менее важен. Если вы ищете самые популярные на сегодняшний день алгоритмы машинного обучения, ознакомьтесь с нашей подборкой:

1. Алгоритм наивного байесовского классификатора

Этот алгоритм хорошо работает с огромными данными, охватывающими миллионы записей в наборе данных. Существует две основные формы этого алгоритма — гауссовский наивный байесовский алгоритм (применяет нормальное распределение к непрерывным значениям атрибутов) и полиномиальный наивный байесовский алгоритм (для данных, которые показывают полиномиальное распределение).

Этот тип алгоритма показывает огромную ценность в:

Анализ настроений (используется Facebook для оценки обновлений статуса)
Категоризация документов (Google использует ее для индексации для PageRank)
Фильтрация спама (используется Google)

2. Алгоритм кластеризации K означает

Это один из самых простых алгоритмов обучения без учителя, который может решить распространенную проблему кластеризации. Он демонстрирует лучшую производительность кластеризации, чем иерархическая кластеризация. Его ключевое приложение используется поисковыми системами, такими как Yahoo и Google. Они используют эту технику для группировки веб-страниц на основе «рейтинга релевантности» поисковых запросов.

3. Алгоритм машинного обучения опорных векторов

Алгоритм SVM продолжает изучение классифицированного набора данных, чтобы понять шаблон классификации и применить его к новым данным. Известно, что в обучающих наборах данных SVM обеспечивает высокую точность и невероятную производительность классификации. Он использует концепцию гиперплоскости (линии) для классификации данных. Чем больше он удален от гиперплоскости, тем выше точность его классификации.

Этот алгоритм широко используется в финансовых секторах, где аналитики пытаются сравнить акции и их движение по отношению к акциям конкурентов или эталонным акциям.

4. Линейная регрессия

Проще говоря, он сравнивает взаимосвязь между двумя переменными и оценивает, как изменение одной влияет на другую и в какой степени. Он используется малым и средним бизнесом для прогнозирования доходов и роста команды.

Например, если продажи следуют линейной тенденции, этот алгоритм может точно спрогнозировать возможные продажи в ближайшие месяцы.

5. Искусственные нейронные сети

Это класс моделирования алгоритмов, который имитирует биологическую нейронную структуру. Некоторые из популярных алгоритмов в этой категории включают Perceptron, рекуррентную нейронную сеть LSTM, машину Больцмана и сеть радиальных базисных функций (RBFN). Они обычно используются для задач регрессии и классификации.

Эти сети могут объединяться с другими сетями через входной слой, выходной слой и скрытый слой. Это, в свою очередь, формирует несколько слоев, которые порождают глубокие искусственные нейронные сети. Их архитектура расширяет область машинного обучения, позволяя углубиться в глубокое обучение.

Какие другие алгоритмы машинного обучения вы использовали для достижения своих конкретных бизнес-целей? Напишите нам и дайте нам знать.

Первоначально опубликовано на https://www.goodworklabs.com 9 января 2018 г.

5 алгоритмов машинного обучения, которые вы должны знать | Наука о данных

1. Алгоритм наивного байесовского классификатора

2. Алгоритм кластеризации K означает

3. Алгоритм машинного обучения опорных векторов

4. Линейная регрессия

5. Искусственные нейронные сети

Вопросы по теме