Допустим, у меня 5 болезней (а, б, в, г, д). Каждому человеку в выборке задавали вопрос, есть ли у него каждое из заболеваний, а затем присваивали вес (W). Мне нужно определить долю каждой комбинации болезней в популяции. Это может включать комбинации, в которых люди отвечают (1,1) для любой комбинации болезней.
df <- data.frame(
a = c(1, 1, 0, 0),
b = c(1, 1, 0, NA),
c = c(0, 1, NA, 1),
d = c(1, 1, 0, 1 ),
e = c(1, 1, 1, 0 ),
W = c(1.5,3.5,2.5,2.3))
df
a b c d e W
1 1 1 0 1 1 1.5
2 1 1 1 1 1 3.5
3 0 0 NA 0 1 2.5
4 0 NA 1 1 0 2.3
Я смог понять это, чтобы получить матрицу:
DisDyads <- apply (df, 2, function (x) colSums (df == 1 & x == df, na.rm = TRUE))
a b c d e W
a 2 2 1 2 2 0
b 2 2 1 2 2 0
c 1 1 2 2 1 0
d 2 2 2 3 2 0
e 2 2 1 2 3 0
W 0 0 0 0 0 0
Как вместо этого превратить их в пропорции?
Это пример того, как будут выглядеть 1-я и 2-я строки вывода матрицы при правильных условиях и пропорциях:
a b c d e W
a 0.5 0.5 0.25 0.5 0.5 0
b 0.5 0.5 0.25 0.5 0.5 0
Далее мне также необходимо учитывать веса при определении доли каждой комбинации на уровне популяции.
Может кто-нибудь, пожалуйста, помогите мне понять это? Что, если бы я пытался найти соотношение трех комбинаций болезней? Пример. доля людей, у которых есть a,b,c и a,b,d и так далее..
Я очень ценю любую помощь в этом. Заранее спасибо!
a, b, c, ab, ac, bc, abc
. Затем ваши ответы для каждого пациента:1, 2, 3, 4
. Вы не можете изобразить это в матрице комбинаций, которые показывают попарные комбинации. - person Anonymous coward   schedule 17.04.2018