Здесь, в этой статье, мы рассмотрим такие темы, как:

  1. Что такое кластеризация K-средних?
  2. почему он используется?
  3. Как это работает?
  4. Применение?

Итак приступим..

1 ) Что такое кластеризация K-средних?

Кластеризация K-средних — это один из алгоритмов машинного обучения без присмотра, что означает, что он используется, когда в наборе данных нет указанных меток.

2 ) почему он используется?

Основное требование этого алгоритма - когда у нас есть несбалансированные данные, и мы должны делать прогнозы, группируя точки данных. Основная цель - разделить или разделить группы с похожими задачами или признаками.

Цель этого неконтролируемого алгоритма машинного обучения состоит в том, чтобы выбрать кластеры или, скорее, группы в заданном наборе данных с количеством групп, указанным в переменной K. Это работает многократно, чтобы назначить каждую точку данных одному из кластеров K на основе предоставленных функций. Точки данных обычно группируются на основе сходства признаков. Конечными результатами алгоритма кластеризации K-средних будут:

  1. Центроиды числа кластеров, которые были идентифицированы (обозначены как K).
  2. Метки для обучающих данных.

3) Как это работает?

  1. Классифицирует данные по нескольким группам как K (K предопределено).
  2. Выберите K точек произвольно, как центры кластеров.
  3. Распределите точки по ближайшему центру кластера в соответствии с функцией евклидово расстояние.
  4. Вычислите среднее значение или центр тяжести всех объектов в каждом кластере.
  5. Повторяйте шаги 2, 3 и 4 до тех пор, пока совпадающие точки не будут распределены по каждому кластеру в непрерывных раундах.

4) Применение?

  1. Алгоритм кластеризации при выявлении раковых данных

— Алгоритм кластеризации может быть использован для идентификации набора раковых данных. Экспериментально было обнаружено, что набор раковых данных дает наилучшие результаты с неконтролируемыми нелинейными алгоритмами кластеризации, и, следовательно, мы можем сделать вывод о нелинейном характере ракового набора данных.

2. Алгоритм кластеризации в учебных заведениях

  • Возможность отслеживать прогресс в успеваемости студентов была критически важной проблемой для академического сообщества высших учебных заведений.

3. Алгоритм кластеризации в поисковых системах

Алгоритм кластеризации является основой поисковых систем. Поисковые системы стараются группировать похожие объекты в один кластер, а непохожие объекты — далеко друг от друга. Он предоставляет результат для искомых данных в соответствии с ближайшим подобным объектом, который сгруппирован вокруг данных, подлежащих поиску. Чем лучше используется алгоритм кластеризации, тем выше шансы получить требуемый результат на первой странице.

Спасибо за чтение, я надеюсь, что вы нашли это полезным.