Я пытаюсь воспроизвести графики, сделанные seqrep
, используя параметр group=
в TraMineR
, потому что я хочу иметь файл изображения с репрезентативными последовательностями для каждой группы для использования в презентации. Кажется, я упускаю важную часть своего синтаксиса, поскольку подмножество объекта последовательности дает очень разные результаты по сравнению со встроенной опцией group
в TraMineR
. Как вы можете видеть на рисунках ниже, репрезентативные последовательности, идентифицированные seqrep
, сильно различаются. Знаете ли вы, какая часть отсутствует или неверна в моем синтаксисе?
library(TraMineR)
library(WeightedCluster)
data(mvad)
mvad.alphabet <- c("employment", "FE", "HE", "joblessness", "school",
"training")
mvad.labels <- c("Employment", "Further Education", "Higher Education",
"Joblessness", "School", "Training")
mvad.scodes <- c("EM", "FE", "HE", "JL", "SC", "TR")
## Define sequence objects
mvad.seq <- seqdef(mvad[, 17:86], alphabet = mvad.alphabet,
states = mvad.scodes, labels = mvad.labels,
weights = mvad$weight, xtstep = 6)
## Defining cost matrices for OM - custom and transition based
subm.trate <- seqsubm(mvad.seq, method="TRATE")
## Computing dissimilarity matrices
mvad.ham <- seqdist(mvad.seq, method="HAM", sm=subm.trate)
## Clustering OM dissimilarities
wardCluster <- hclust(as.dist(mvad.ham), method = "ward",
members = mvad$weight)
clust4 <- cutree(wardCluster, k = 4)
## Plotting representative sequences
seqrplot(mvad.seq, criterion="dist", group=clust4, dist.matrix=mvad.ham,
withlegend=FALSE, border=NA, weighted=TRUE, stats=FALSE)
seqrplot(mvad.seq[clust4==2,], criterion="dist", dist.matrix=mvad.ham,
withlegend=FALSE, border=NA, weighted=TRUE, stats=FALSE)
Четыре группы репрезентативных последовательностей: см. вторую группу Вторая группа репрезентативных последовательностей