Обзор машинного обучения

После сбора, очистки и предварительной обработки данных для понимания и извлечения из них информации одним из способов их реализации является разработка моделей машинного обучения.

Можно сказать, что машинное обучение является подполем в области науки о данных, а также в области ИИ (искусственного интеллекта), поскольку название подразумевает, что компьютер может учиться и делать прогнозы на основе полученных данных. Это важно, поскольку привело к созданию важных моделей, таких как прогнозы погоды, обнаружение мошенничества и т. д.

Существует три типа машинного обучения

  • Контролируемое машинное обучение
  • Неконтролируемое машинное обучение
  • Машинное обучение с подкреплением
  • Контролируемое машинное обучение: это тип машинного обучения, при котором оно имеет целевое значение. Он состоит из данных, используемых для прогнозирования (независимые переменные), и прогнозируемого целевого значения (зависимые переменные).

Существует два типа контролируемого машинного обучения:

  • Регрессия
  • Классификация

Регрессия. Регрессия — это аспект контролируемого машинного обучения, связанный с прогнозированием количественных или числовых данных. В этом типе машинного обучения с учителем все значения являются числовыми, и он отображает их (характеристики используемых данных) на графике, а затем рисует над ними линию, которую можно назвать линией наилучшего соответствия. Этот алгоритм прогнозирования может быть представлен в виде y=mx+c (уравнение прямой), где x — признак (при условии, что для предсказания использовался только один признак), а m и c — константы, полученные на основе результатов компьютера. Например, y=26x+7 принимает значение признака в новых данных x=15, а затем использует формулу для его применения y=26*15+7, y=397.

Когда количество признаков увеличивается, их можно записать как y=c+mx, mx2, mx3...

Это можно использовать при прогнозировании значений цен на жилье или других числовых операциях. Модель, которая делает это, — модель линейной регрессии Sk-learn.

Классификация: В отличие от регрессии, классификация использует качественные значения в качестве целевых значений. Данные состоят из значений, которые являются числовыми или логическими, в то время как целевые значения представляют собой имена классифицированных значений, которые должны быть предсказаны, каждая функция оценивается и разделяется компьютером с помощью некоторого сложного алгоритма, поэтому, когда он оценивает каждую из функций тестовых данных, он будет отнести его к одной из перечисленных категорий. Это делается в различных реальных сценариях, таких как модель обнаружения мошенничества или модель классификации изображений. Существует несколько моделей классификации, таких как классификатор дерева решений, логистическая регрессия (это говорит о регрессии, но она используется для построения моделей классификации), классификатор K-соседей, классификатор случайного леса и так далее.

  • Неконтролируемое машинное обучение: это тип алгоритма машинного обучения, в котором нет целевого значения, но компьютер, находя совпадения между ними, классифицирует или группирует данные в кластеры на основе их значений. Как упоминалось выше, целевого значения нет, но цель компьютера — найти связь между каждым значением, это используется в алгоритмах, таких как системы рекомендаций фильмов, на основе фильмов и получения того, что вы смотрите, как вам нравится. Этот метод моделирования называется кластеризацией. Одним из алгоритмов кластеризации Sk-learn является кластеризация KMeans.
  • Машинное обучение с подкреплением: это аспект машинного обучения, при котором компьютер учится взаимодействовать с окружающей средой, примерами таких игр являются такие игры, как шахматы, в которых компьютер не знает игру, но учится играть в нее со временем в соответствии с правила игры, еще один пример — беспилотные автомобили, в которых есть датчики движения, которые помогают компьютеру научиться двигаться в определенных сценариях.

Четыре основных шага или линии построения модели в машинном обучении после визуализации и предварительной обработки:

1. Разделите обработанные данные на набор поездов и тестовый набор.

2. Загрузите или импортируйте используемую модель.

3. Используйте тренировочный набор для обучения модели.

4. Оцените модель, используя соответствующий метод с набором тестов.

От простого моделирования, такого как прогнозирование цен на жилье, до сложных, таких как распознавание изображений, машинное обучение автоматизировало множество задач и во многих отношениях улучшило информационные технологии.

Спасибо, что прочитали эту статью, лайкните, поделитесь и прокомментируйте, что вы думаете или что я не смог добавить, спасибо.