Дерево согласования или пропорции начальной загрузки из нескольких объектов hclust

У меня есть список объектов hclust в результате незначительных изменений одной переменной (для вычисления матрицы расстояний)

  • теперь я хотел бы сделать дерево консенсуса из этого списка.

Есть ли для этого универсальный пакет? Я пробиваюсь через какой-то код от maanova, и кажется, что он работает, но он уродлив и требует много взлома, поскольку я не выполняю «нормальную» загрузку (это химические данные).

/ Палле Виллесен, Дания

c1_list <- seq(10,100,by=10)
c2 <- 30
e<- 1
mboot <- list()
for (i in 1: length(c1_list) ) {
   c1 <- c1_list[i]
   cat("Doing C1=",c1,"...")
   x <- hclust(custom_euclidean(t(log2(data[, all]+1)), c1,c2,e), method='average')
   cat("..done\n")
   mboot[[i]] <- x # To get hclust object back use mbot[[i]] to get i'th object
}

#### Now extract the robust groups from mboot...

person Community    schedule 29.10.2009    source источник


Ответы (2)


Сначала взгляните на код Аллана Такера для консенсусной кластеризации, связанный с его документ «Консенсусная кластеризация и функциональная интерпретация данных экспрессии генов».

Вот еще несколько указателей:

person Shane    schedule 31.10.2009
comment
Большое спасибо, это похоже на то, что я ищу. И да - я видел функцию connsus (), но мне нужно было создать правильный объект из нескольких объектов hclust (+ некоторые дополнительные вещи) ... Также он создает сжатую дендрограмму, где мне нужны пропорции начальной загрузки ... Итак, это было почему я искал более простую функцию, которая просто сравнивает n объектов hclust и создает какой-то консенсус ... - person ; 09.11.2009

Хм, это похоже на метод ускорения, применяемый к кластеризации, и быстрый поиск в Google обнаруживает вполне существующую литературу по ускорение кластеризации. Может, это начало?

Что касается кода R, всегда есть представления задач в кластеризации и Машинное обучение.

person Dirk Eddelbuettel    schedule 29.10.2009