Дерево согласования или пропорции начальной загрузки из нескольких объектов hclust

У меня есть список объектов hclust в результате незначительных изменений одной переменной (для вычисления матрицы расстояний)

теперь я хотел бы сделать дерево консенсуса из этого списка.

Есть ли для этого универсальный пакет? Я пробиваюсь через какой-то код от maanova, и кажется, что он работает, но он уродлив и требует много взлома, поскольку я не выполняю «нормальную» загрузку (это химические данные).

/ Палле Виллесен, Дания

c1_list <- seq(10,100,by=10)
c2 <- 30
e<- 1
mboot <- list()
for (i in 1: length(c1_list) ) {
   c1 <- c1_list[i]
   cat("Doing C1=",c1,"...")
   x <- hclust(custom_euclidean(t(log2(data[, all]+1)), c1,c2,e), method='average')
   cat("..done\n")
   mboot[[i]] <- x # To get hclust object back use mbot[[i]] to get i'th object
}

#### Now extract the robust groups from mboot...

r hclust dendrogram

Community 29.10.2009 источник

Ответы (2)

arrow_upward
1
arrow_downward

Сначала взгляните на код Аллана Такера для консенсусной кластеризации, связанный с его документ «Консенсусная кластеризация и функциональная интерпретация данных экспрессии генов».

Вот еще несколько указателей:

Вы упомянули, что используете пакет maanova; это может построить консенсусное дерево из результата загрузочного кластера с помощью функции consensus(). Вы пробовали это?
пакет ape предназначен для анализа филогенетического дерева, поэтому, возможно, он не полностью актуально, но вы можете изучить это. Есть пример использования hclust в R-Help.
Точно так же пакет nem, который является частью bioconductor, имеет Некоторые примеры.

Shane 31.10.2009

comment

Большое спасибо, это похоже на то, что я ищу. И да - я видел функцию connsus (), но мне нужно было создать правильный объект из нескольких объектов hclust (+ некоторые дополнительные вещи) ... Также он создает сжатую дендрограмму, где мне нужны пропорции начальной загрузки ... Итак, это было почему я искал более простую функцию, которая просто сравнивает n объектов hclust и создает какой-то консенсус ... - ; 09.11.2009

arrow_upward
0
arrow_downward

Хм, это похоже на метод ускорения, применяемый к кластеризации, и быстрый поиск в Google обнаруживает вполне существующую литературу по ускорение кластеризации. Может, это начало?

Что касается кода R, всегда есть представления задач в кластеризации и Машинное обучение.

Dirk Eddelbuettel 29.10.2009

Дерево согласования или пропорции начальной загрузки из нескольких объектов hclust

Ответы (2)

Вопросы по теме