Здесь, в этой статье, мы рассмотрим такие темы, как:
- Что такое кластеризация K-средних?
- почему он используется?
- Как это работает?
- Применение?
Итак приступим..
1 ) Что такое кластеризация K-средних?
Кластеризация K-средних — это один из алгоритмов машинного обучения без присмотра, что означает, что он используется, когда в наборе данных нет указанных меток.
2 ) почему он используется?
Основное требование этого алгоритма - когда у нас есть несбалансированные данные, и мы должны делать прогнозы, группируя точки данных. Основная цель - разделить или разделить группы с похожими задачами или признаками.
Цель этого неконтролируемого алгоритма машинного обучения состоит в том, чтобы выбрать кластеры или, скорее, группы в заданном наборе данных с количеством групп, указанным в переменной K. Это работает многократно, чтобы назначить каждую точку данных одному из кластеров K на основе предоставленных функций. Точки данных обычно группируются на основе сходства признаков. Конечными результатами алгоритма кластеризации K-средних будут:
- Центроиды числа кластеров, которые были идентифицированы (обозначены как K).
- Метки для обучающих данных.
3) Как это работает?
- Классифицирует данные по нескольким группам как K (K предопределено).
- Выберите K точек произвольно, как центры кластеров.
- Распределите точки по ближайшему центру кластера в соответствии с функцией евклидово расстояние.
- Вычислите среднее значение или центр тяжести всех объектов в каждом кластере.
- Повторяйте шаги 2, 3 и 4 до тех пор, пока совпадающие точки не будут распределены по каждому кластеру в непрерывных раундах.
4) Применение?
- Алгоритм кластеризации при выявлении раковых данных
— Алгоритм кластеризации может быть использован для идентификации набора раковых данных. Экспериментально было обнаружено, что набор раковых данных дает наилучшие результаты с неконтролируемыми нелинейными алгоритмами кластеризации, и, следовательно, мы можем сделать вывод о нелинейном характере ракового набора данных.
2. Алгоритм кластеризации в учебных заведениях
- Возможность отслеживать прогресс в успеваемости студентов была критически важной проблемой для академического сообщества высших учебных заведений.
3. Алгоритм кластеризации в поисковых системах
Алгоритм кластеризации является основой поисковых систем. Поисковые системы стараются группировать похожие объекты в один кластер, а непохожие объекты — далеко друг от друга. Он предоставляет результат для искомых данных в соответствии с ближайшим подобным объектом, который сгруппирован вокруг данных, подлежащих поиску. Чем лучше используется алгоритм кластеризации, тем выше шансы получить требуемый результат на первой странице.
Спасибо за чтение, я надеюсь, что вы нашли это полезным.