Статьи по теме clustering

Публикации по теме 'clustering'

Алгоритм кластеризации k-средних и его реальные варианты использования в области безопасности

👉 Кластеризация K-средних — это алгоритм обучения без учителя , который группирует немаркированный набор данных в разные кластеры. Здесь K определяет количество предопределенных кластеров, которые необходимо создать в процессе, например, если K = 2, будет два кластера, а для K = 3 будет три кластера и так далее. Кластеризация методом K-средних – это итеративный алгоритм, который делит немаркированный набор данных на k разных кластеров таким образом, что каждый набор данных..

Кластеризация клиентов торгового центра — K-Means (машинное обучение)

У нас есть некоторые основные данные о клиентах, такие как идентификатор клиента, возраст, пол, годовой доход и оценка расходов. Оценка расходов присваивается клиенту на основе некоторых параметров, таких как поведение клиента и данные о покупках. Мы постараемся сгруппировать эти данные по этим признакам. import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns # Read data df = pd.read_csv("../input/Mall_Customers.csv") # Info df.info()..

Фантастические водители и как их найти

Как мы создали алгоритм, который мог идентифицировать и различать кластеры так же интуитивно, как человеческий глаз Заявление о проблеме POI или Достопримечательность в нашем контексте определяется как место, где происходит большое количество посадки. Это может быть любое популярное место, такое как торговый центр, вокзал или даже большой жилой комплекс. В более ранних версиях нашего приложения, когда пользователь заказывал GO-RIDE или GO-CAR в POI, ему приходилось..

Определение идеального количества кластеров

Введение Спасибо, что посетили мою первую работу на Medium. Цель здесь состоит в том, чтобы представить некоторые способы определения наилучшего количества кластеров. Кластеризация используется для различных задач, таких как сегментация клиентов, анализ данных, уменьшенная размерность, обнаружение аномалий, частично контролируемое обучение, поисковые системы и сегментация изображений. Качество кластера зависит от выбранного алгоритма, функции расстояния и приложения. Говорят, что..

Кластеризация аудио с глубоким обучением

1. Введение Глубокие нейронные сети популярны для обработки различных изображений или задач НЛП. Однако в последнее время наблюдается всплеск исследований, посвященных звуковым задачам с использованием методов глубокого обучения. Некоторые из методов глубокого обучения были заимствованы из задач обработки изображений, однако звук сильно отличается, поскольку представляет собой сигнал одномерного временного ряда, который отличается от двумерного изображения. Методы глубокого обучения..

k-Medoids Clustering - Серия аналитических функций.

О программе: «Кластеризация k-Medoids» сочетает в себе алгоритмы k-Means и алгоритмы сдвига медоидов с целью разделения n-наблюдений на k кластеров, в которых каждое наблюдение принадлежит кластеру с ближайшим медоид. Медоид конечного набора данных — это точка данных (одно из наблюдений) из этого набора, средняя непохожесть которой на все точки данных минимальна. Ввод: Функция принимает следующие входные данные: Метрика взвешивания терминов : метрика, которую следует учитывать..

Странный эффект K-Means (и это плохо)

В тот момент, когда я узнал, как работает k-means для кластеризации данных в этом замечательном курсе Эндрю Нг , я понял, что с этим алгоритмом может быть что-то не так, если я добавлю какие-то необычные, несбалансированные данные. В этом алгоритме я заметил две вещи. Во-первых, это уклон в сторону более плотной области. Вы знаете, если у вас есть много точек в одной области, функция среднего (среднего) будет стремиться переместить центр тяжести в эту область. Это имеет смысл, поскольку..