У меня есть набор данных с диагнозами в качестве переменных и пациентами в качестве наблюдений. Это 32 переменных и 5000 наблюдений.
Взгляните на этот пример.
Моя цель - подсчитать и суммировать все диагнозы во фрейме данных.
set.seed(1)
Data <- data.frame(id = seq(1, 10),
Diag1 = sample(c("A123", "B123", "C123"), 10, replace = TRUE),
Diag2 = sample(c("D123", "E123", "F123"), 10, replace = TRUE),
Diag3 = sample(c("G123", "H123", "I123"), 10, replace = TRUE),
Diag4 = sample(c("A123", "B123", "C123"), 10, replace = TRUE),
Diag5 = sample(c("J123", "K123", "L123"), 10, replace = TRUE),
Diag6 = sample(c("M123", "N123", "O123"), 10, replace = TRUE),
Diag7 = sample(c("P123", "Q123", "R123"), 10, replace = TRUE))
Data
class(Data)
mode(Data)
Я знаю, как это сделать для одной колонки с помощью пакета plyr
NoDiag1 <- count(Data, "Diag1")
Как я могу сделать это для всего фрейма данных вместо одной переменной?
Если это невозможно, как я могу добавить столбцы 1-7 к одному столбцу, чтобы я мог использовать функцию подсчета для этого «объединенного» столбца?
"AB12"
2 или 4?) - person Señor O   schedule 18.09.2013count(Data[,-1])
? - person Ferdinand.kraft   schedule 18.09.2013