Описание каждого типа задач и значение этих терминов.

Изучая машинное обучение, вы, вероятно, так или иначе сталкивались с этими словарными словами (особенно с классификацией, популярным типом задач, представленным на начальных этапах учебного плана по машинному обучению). Позже, возможно, появились и эти другие термины. Ниже приводится описание различий между классификацией, регрессией и кластеризацией.

Классификация
Здесь модели машинного обучения предсказывают категорию/класс на основе типа входных данных. Может быть два класса для прогнозирования (бинарная классификация) или более 2 классов (мультиклассовая классификация). Например, если в наборе данных есть разные типы животных, такие как собака, кошка и кролик, то задача классификации состоит в том, чтобы предсказать при наличии изображения из этого набора данных, к какой категории животных относится это изображение.

Тип используемой модели:
Сверточные нейронные сети: нелинейная модель, которая определяет вероятность классов, которыми может быть определенная точка входных данных. Например, для изображения кошки результирующие вероятности могут составлять 0,9 кошки, 0,04 кролика и 0,06 собаки.

Дополнительные приложения:
- Обнаружение эмоций (счастлив ли человек, грустит ли он и т. д.)
- Обнаружение положительных/отрицательных отзывов
- Распознавание лиц (назначение имени лицу)

Кластеризация

Кластеризация — это тип задачи, целью которой является разделение набора данных и объединение определенных точек данных в группы со схожими свойствами или функциями. Например, имея набор данных с тремя цветами кружков: черным, зеленым и красным, задача состоит в том, чтобы разделить их на 3 группы на основе цветового признака.

Тип используемой модели:
кластеризация K-средних: этот алгоритм делит n наблюдений/точек данных на k кластеров.

Дополнительные приложения
 – Городское планирование – группировка определенных домов по географическому положению для изучения различий в цене, характеристиках и т. д.
 – Библиотеки – группировка определенных книг по жанру (научная фантастика, научно-популярная литература и т. д.). )
- Изучение землетрясений: отметьте области, пострадавшие от землетрясений, чтобы определить опасные и безопасные зоны.

Регрессия
В регрессии задача состоит в том, чтобы найти наиболее подходящую линию для данных или определить вероятность события, чтобы предсказать результат, числовое значение переменной. Нам нужно найти корреляции между зависимыми (y) и независимыми (x) переменными. Чтобы дать модели ML информацию о точном прогнозировании выходного значения, модель необходимо обучить на прошлых данных для прогнозирования будущих значений данных.

Тип используемой модели:

Линейная регрессия: линейная модель, которая определяет значение переменной y на основе линейной зависимости между x и y. Например, медицинские исследователи могут использовать линейную регрессию для прогнозирования взаимосвязи между дозировкой лекарства и кровяным давлением пациента: в основном, пытаясь понять взаимосвязь между количеством дозы лекарства и тем, как изменяется кровяное давление пациентов в зависимости от этой дозировки лекарства.

Дополнительные приложения

  • Основываясь на ценах на жилье за ​​последние 10 лет в определенном месте, спрогнозируйте цены на жилье в этом месте на 3 года вперед.
  • Основываясь на погоде, которая наблюдалась за последние 10 дней в этом определенном районе, спрогнозируйте завтрашнюю погоду в этом районе.
  • Прогнозировать тенденции акций определенной компании на основе прошлой стоимости акций этой компании.

Процитированные источники

https://www.simplilearn.com/tutorials/data-analytics-tutorial/classification-vs-clustering

https://www.statology.org/linear-regression-real-life-examples/

https://www.onegreenplanet.org/animalsandnature/selling-nonrescued-dogs-cats-and-rabbits-in-stores-is-now-illegal-in-california/

https://www.geeksforgeeks.org/clustering-in-machine-learning/

https://www.javatpoint.com/regression-vs-classification-in-machine-learning

https://towardsdatascience.com/everything-you-need-to-know-about-linear-regression-b791e8f4bd7a