У меня есть следующие панельные данные с некоторыми людьми, у которых больше наблюдений, чем у других.
id <- c("John","John","John","John","John",
"Mike","Mike","Mike","Mike",
"Andrea","Andrea","Andrea","Andrea","Andrea","Andrea","Andrea")
time <- c(1:5, 1:4, 1:7)
observation <- c(rnorm(1:5), rnorm(1:4), rnorm(1:7))
paneldata <- data.frame(id, time, observation)
Я хочу рассчитать корреляцию для наблюдений среди людей. R должен игнорировать отсутствующие наблюдения, например.
Корреляция между Майком и Джоном: следует учитывать только время с 1 по 4.
Корреляция между Джоном и Андреа: только время от 1 до 5 и т. д.
Как лучше всего достичь этих результатов?