Как сгруппировать данную выборку в центры классов, рассчитанные с помощью алгоритма спектральной кластеризации?

Допустим, мы получили несколько центров {C1(d1, d2...dn), C2...} с обучающими выборками по алгоритму спектральной кластеризации. Если задан новый вектор тестовой выборки (x1,... xn), что мне делать, чтобы поместить его в класс?

Обратите внимание, что матрица подобия, которую мы использовали в процессе спектральной кластеризации, основана не только на евклидовом расстоянии между обучающими векторами, но и на геодезическом расстоянии. Таким образом, расстояние не может быть вычислено с помощью всего лишь двух векторов, а центр класса получить не так просто, как то, что мы можем сделать с помощью K-средних.

Одно из решений, которое у меня есть, это алгоритм k-ближайших соседей. Есть ли другие решения?


person Potemkin    schedule 05.01.2011    source источник
comment
С методами спектральной кластеризации вы не получаете несколько центров, вы обычно получаете двоичное разделение на основе собственного вектора, связанного со вторым по величине собственным значением лапласиана матрицы подобия.   -  person carlosdc    schedule 06.01.2011
comment
Не могли бы вы дать нам более подробную информацию о том, какой именно алгоритм спектральной кластеризации вы используете?   -  person Stompchicken    schedule 06.01.2011
comment
@StompChicken: я думаю, что под «каким sc» вы имеете в виду, какой тип лапласиана я использую или какую матрицу расстояний я выбираю.   -  person Potemkin    schedule 07.01.2011
comment
@StompChicken: у нас есть график G = ‹V, E›. Каждый вектор здесь представляет одну обучающую выборку, а вес на ребре между двумя векторами представляет собой расстояние между ними, которое подчиняется неравенству треугольника. Учитывая это, мы можем разделить эти узлы (векторы) на несколько кластеров, используя алгоритм спектральной кластеризации. Теперь у нас есть новый тестовый узел, и мы можем получить расстояния или веса между тестовым узлом и каждым существующим на графе. Проблема в том, можем ли мы быстро получить его метку?   -  person Potemkin    schedule 07.01.2011


Ответы (1)


В случае спектральной кластеризации результат не подлежит обновлению, поскольку, если вы добавите еще один экземпляр/вектор, вам придется повторить весь процесс путем пересчета матрицы аффинности/лапласиана, выполнения собственного разложения, а затем кластеризации строк сокращенного матрица.

person Amro    schedule 07.01.2011