Лучшие алгоритмы для машинного обучения

Типы алгоритмов машинного обучения

Алгоритмы машинного обучения можно разделить на 3 различных типа, а именно:

Алгоритмы контролируемого машинного обучения
Представьте, что учитель наблюдает за классом. Учитель уже знает правильные ответы, но процесс обучения не останавливается, пока ученики тоже не узнают ответы (бедные дети!). В этом суть алгоритмов контролируемого машинного обучения. Здесь алгоритм — это ученик, который учится на обучающем наборе данных и делает прогнозы, которые корректируются учителем. Этот процесс обучения продолжается до тех пор, пока алгоритм не достигнет требуемого уровня производительности.

Алгоритмы машинного обучения без присмотра:
В этом случае в классе нет учителя, и бедные ученики вынуждены учиться сами! Это означает, что для неконтролируемых алгоритмов машинного обучения нет конкретного ответа, который нужно изучить, и нет учителя. Алгоритм остается без присмотра, чтобы найти основную структуру в данных, чтобы узнать все больше и больше о самих данных.

Алгоритмы машинного обучения с подкреплением.
Вот гипотетические студенты, которые со временем учатся на своих ошибках (это как в жизни!). Таким образом, алгоритмы машинного обучения с подкреплением изучают оптимальные действия методом проб и ошибок. Это означает, что алгоритм определяет следующее действие, изучая поведение, основанное на его текущем состоянии, которое максимизирует вознаграждение в будущем.

Алгоритмы

Существуют специальные алгоритмы машинного обучения, которые были разработаны для решения сложных проблем с данными в реальном мире. Итак, теперь, когда мы рассмотрели типы алгоритмов машинного обучения, давайте изучим лучшие алгоритмы машинного обучения, которые существуют и фактически используются специалистами по данным.

1. Алгоритм наивного байесовского классификатора
Что произойдет, если вам придется классифицировать тексты данных, такие как веб-страница, документ или электронное письмо, вручную? Ну, ты бы сошел с ума! Но, к счастью, эту задачу выполняет алгоритм наивного байесовского классификатора. Этот алгоритм основан на теореме Байеса о вероятности и присваивает значение элемента совокупности из одной из доступных категорий.

Примером использования алгоритма наивного байесовского классификатора является фильтрация спама в электронной почте. Gmail использует этот алгоритм, чтобы классифицировать электронное письмо как спам или не спам.

2. K означает алгоритм кластеризации
Давайте представим, что вы хотите найти термин «дата» в Википедии. Теперь «свидание» может относиться к фруктам, конкретному дню или даже романтическому вечеру с любимым!!! Таким образом, Википедия группирует веб-страницы, которые говорят об одних и тех же идеях, используя алгоритм кластеризации K-средних. K означает, что алгоритм кластеризации обычно использует K кластеров для работы с заданным набором данных. Таким образом, выходные данные содержат K кластеров, а входные данные разделены между кластерами.

3. Алгоритм опорных векторов
Алгоритм опорных векторов используется для задач классификации или регрессии. При этом данные делятся на разные классы путем нахождения определенной линии (гиперплоскости), которая разделяет набор данных на несколько классов. Алгоритм машины опорных векторов пытается найти гиперплоскость, которая максимизирует расстояние между классами (известное как максимизация поля), поскольку это увеличивает вероятность более точной классификации данных.

Примером использования алгоритма машины опорных векторов является сравнение эффективности акций для акций в одном и том же секторе. Это помогает в управлении инвестиционными решениями финансовых учреждений.

4. Априорный алгоритм
Априорный алгоритм создает правила ассоциации, используя формат IF_THEN. Это означает, что ЕСЛИ произошло событие А, то с определенной вероятностью произойдет и событие В. Например: ЕСЛИ человек покупает машину, ТО он также покупает страховку на машину. Алгоритм априори генерирует это правило ассоциации, наблюдая за количеством людей, купивших автострахование после покупки автомобиля.

Пример использования априорного алгоритма — автозаполнение Google. Когда слово вводится в Google, алгоритм Apriori ищет связанные слова, которые обычно вводятся после этого слова, и отображает возможные варианты.

5. Алгоритм линейной регрессии
Алгоритм линейной регрессии показывает взаимосвязь между независимой и зависимой переменной. Он демонстрирует влияние на зависимую переменную, когда независимая переменная изменяется каким-либо образом. Таким образом, независимая переменная называется объясняющей переменной, а зависимая переменная называется интересующим фактором. Примером использования алгоритма линейной регрессии является оценка рисков в области страхования. Линейный регрессионный анализ можно использовать для определения количества претензий для клиентов разного возраста, а затем сделать вывод о повышении риска по мере увеличения возраста клиента.

6. Алгоритм логистической регрессии
Алгоритм логистической регрессии работает с дискретными значениями, тогда как алгоритм линейной регрессии обрабатывает прогнозы с непрерывными значениями. Таким образом, логистическая регрессия подходит для бинарной классификации, при которой, если событие происходит, оно классифицируется как 1, а если нет, оно классифицируется как 0. Следовательно, вероятность возникновения конкретного события прогнозируется на основе заданных переменных-предикторов.

Примером использования алгоритма логистической регрессии является политика, чтобы предсказать, выиграет или проиграет конкретный кандидат на политических выборах.

7. Алгоритм деревьев решений
Предположим, вы хотите выбрать место для своего дня рождения. Таким образом, есть много вопросов, которые влияют на ваше решение, такие как «Ресторан итальянский?», «Есть ли в ресторане живая музыка?», «Ресторан близко к вашему дому?» и т.д. На каждый из этих вопросов есть ответ ДА ​​или НЕТ, который влияет на ваше решение.

Это то, что в основном происходит в алгоритме деревьев решений. Здесь все возможные результаты решения показаны с использованием методологии ветвления дерева. Внутренние узлы тестируются по различным атрибутам, ветви дерева — это результаты тестов, а конечные узлы — это решение, принятое после вычисления всех атрибутов.

Примером использования алгоритма деревьев решений является банковская отрасль для классификации заявителей на получение ссуды по их вероятности невыполнения обязательств по указанным платежам по ссуде.

8. Алгоритм случайных лесов
Алгоритм случайных лесов обрабатывает некоторые ограничения алгоритма деревьев решений, а именно то, что точность результата уменьшается, когда количество решений в дереве увеличивается.

Итак, в алгоритме случайных лесов есть несколько деревьев решений, которые представляют различные статистические вероятности. Все эти деревья сопоставляются с одним деревом, известным как модель CART. (Деревья классификации и регрессии). В конце концов, окончательный прогноз для алгоритма случайных лесов получается путем опроса результатов всех деревьев решений.

Примером использования алгоритма случайных лесов является автомобильная промышленность, чтобы предсказать будущую поломку любой конкретной автомобильной детали.

9. Алгоритм K ближайших соседей
Алгоритм K ближайших соседей делит точки данных на разные классы на основе аналогичной меры, такой как функция расстояния. Затем делается прогноз для новой точки данных путем поиска во всем наборе данных K наиболее похожих экземпляров (соседей) и суммирования выходной переменной для этих K экземпляров. Для задач регрессии это может быть среднее значение результатов, а для задач классификации это может быть мода (наиболее частый класс).

Алгоритму K ближайших соседей может потребоваться много памяти или места для хранения всех данных, но он выполняет вычисления (или учится) только тогда, когда необходим прогноз, точно во время.

10. Алгоритм искусственных нейронных сетей
Человеческий мозг содержит нейроны, которые являются основой нашей способности к запоминанию и являются острыми (по крайней мере, для некоторых из нас!). Итак, искусственные нейронные сети пытаются воспроизвести нейроны в человеческом мозгу, создавая узлы, которые взаимосвязаны друг с другом. Эти нейроны получают информацию через другой нейрон, выполняют различные действия по мере необходимости, а затем передают информацию другому нейрону в качестве вывода.

Примером искусственных нейронных сетей является распознавание лиц человека. Изображения с человеческими лицами можно идентифицировать и отличить от «нелицевых» изображений. Однако это может занять несколько часов в зависимости от количества изображений в базе данных, тогда как человеческий разум может сделать это мгновенно.

Кредиты

Geeksforgeeeks, Википедия