В кластере H2O KMeans. есть ли способ рассчитать фактические расстояния от центроидов кластера для каждой точки в наборе данных? В настоящее время H2o дает прогнозируемый кластер для переданных данных, но как лучше всего получить расстояние точки от центра тяжести кластера.
Я намереваюсь сделать это для обнаружения аномалий, когда точки, найденные далеко от центроида, рассматриваются как аномалии. Я не использовал Apache Spark, но намерен попробовать это с помощью Sparking Water, но H2o Api, похоже, не показывает лучший способ получить расстояния для каждой точки от центра тяжести кластера.