Получите расстояние от точки до центроида кластера в H2o KMEANS Clustering

В кластере H2O KMeans. есть ли способ рассчитать фактические расстояния от центроидов кластера для каждой точки в наборе данных? В настоящее время H2o дает прогнозируемый кластер для переданных данных, но как лучше всего получить расстояние точки от центра тяжести кластера.

Я намереваюсь сделать это для обнаружения аномалий, когда точки, найденные далеко от центроида, рассматриваются как аномалии. Я не использовал Apache Spark, но намерен попробовать это с помощью Sparking Water, но H2o Api, похоже, не показывает лучший способ получить расстояния для каждой точки от центра тяжести кластера.


person Nkuli Thangelane    schedule 05.03.2018    source источник


Ответы (1)


К сожалению, в настоящее время нет способа сделать это из R или Python. У H2O есть метод в Java, но он никогда не отображался в R/Python, поэтому я добавил билет для этого здесь.

А пока вы можете написать собственный код для этого или использовать автокодировщик глубокого обучения для обнаружения аномалий (пример доступен в этом руководство).

person Erin LeDell    schedule 06.03.2018
comment
Привет, Эрин. В настоящее время я использую Apache Spark KMEANS, однако я также использую автоэнкодер, который дает хорошие результаты, спасибо. - person Nkuli Thangelane; 14.03.2018