Обзор машинного обучения
После сбора, очистки и предварительной обработки данных для понимания и извлечения из них информации одним из способов их реализации является разработка моделей машинного обучения.
Можно сказать, что машинное обучение является подполем в области науки о данных, а также в области ИИ (искусственного интеллекта), поскольку название подразумевает, что компьютер может учиться и делать прогнозы на основе полученных данных. Это важно, поскольку привело к созданию важных моделей, таких как прогнозы погоды, обнаружение мошенничества и т. д.
Существует три типа машинного обучения
- Контролируемое машинное обучение
- Неконтролируемое машинное обучение
- Машинное обучение с подкреплением
- Контролируемое машинное обучение: это тип машинного обучения, при котором оно имеет целевое значение. Он состоит из данных, используемых для прогнозирования (независимые переменные), и прогнозируемого целевого значения (зависимые переменные).
Существует два типа контролируемого машинного обучения:
- Регрессия
- Классификация
Регрессия. Регрессия — это аспект контролируемого машинного обучения, связанный с прогнозированием количественных или числовых данных. В этом типе машинного обучения с учителем все значения являются числовыми, и он отображает их (характеристики используемых данных) на графике, а затем рисует над ними линию, которую можно назвать линией наилучшего соответствия. Этот алгоритм прогнозирования может быть представлен в виде y=mx+c (уравнение прямой), где x — признак (при условии, что для предсказания использовался только один признак), а m и c — константы, полученные на основе результатов компьютера. Например, y=26x+7 принимает значение признака в новых данных x=15, а затем использует формулу для его применения y=26*15+7, y=397.
Когда количество признаков увеличивается, их можно записать как y=c+mx, mx2, mx3...
Это можно использовать при прогнозировании значений цен на жилье или других числовых операциях. Модель, которая делает это, — модель линейной регрессии Sk-learn.
Классификация: В отличие от регрессии, классификация использует качественные значения в качестве целевых значений. Данные состоят из значений, которые являются числовыми или логическими, в то время как целевые значения представляют собой имена классифицированных значений, которые должны быть предсказаны, каждая функция оценивается и разделяется компьютером с помощью некоторого сложного алгоритма, поэтому, когда он оценивает каждую из функций тестовых данных, он будет отнести его к одной из перечисленных категорий. Это делается в различных реальных сценариях, таких как модель обнаружения мошенничества или модель классификации изображений. Существует несколько моделей классификации, таких как классификатор дерева решений, логистическая регрессия (это говорит о регрессии, но она используется для построения моделей классификации), классификатор K-соседей, классификатор случайного леса и так далее.
- Неконтролируемое машинное обучение: это тип алгоритма машинного обучения, в котором нет целевого значения, но компьютер, находя совпадения между ними, классифицирует или группирует данные в кластеры на основе их значений. Как упоминалось выше, целевого значения нет, но цель компьютера — найти связь между каждым значением, это используется в алгоритмах, таких как системы рекомендаций фильмов, на основе фильмов и получения того, что вы смотрите, как вам нравится. Этот метод моделирования называется кластеризацией. Одним из алгоритмов кластеризации Sk-learn является кластеризация KMeans.
- Машинное обучение с подкреплением: это аспект машинного обучения, при котором компьютер учится взаимодействовать с окружающей средой, примерами таких игр являются такие игры, как шахматы, в которых компьютер не знает игру, но учится играть в нее со временем в соответствии с правила игры, еще один пример — беспилотные автомобили, в которых есть датчики движения, которые помогают компьютеру научиться двигаться в определенных сценариях.
Четыре основных шага или линии построения модели в машинном обучении после визуализации и предварительной обработки:
1. Разделите обработанные данные на набор поездов и тестовый набор.
2. Загрузите или импортируйте используемую модель.
3. Используйте тренировочный набор для обучения модели.
4. Оцените модель, используя соответствующий метод с набором тестов.
От простого моделирования, такого как прогнозирование цен на жилье, до сложных, таких как распознавание изображений, машинное обучение автоматизировало множество задач и во многих отношениях улучшило информационные технологии.
Спасибо, что прочитали эту статью, лайкните, поделитесь и прокомментируйте, что вы думаете или что я не смог добавить, спасибо.