У меня мало опыта работы с панельными данными в R, и я пытаюсь запустить простую регрессию панелей с пакетом plm. Однако при преобразовании моего фрейма данных в pdata.frame моя временная индексная переменная преобразуется в факторную переменную. Это означает, что если я хочу регрессировать зависимую переменную как функцию времени, регрессия генерирует длинный список фиктивных переменных для времени и вычисляет индивидуальные коэффициенты для каждой. Мне просто нужен средний эффект за единицу времени (т.е. среднемесячное увеличение / уменьшение в пунктах).
Пример фрейма данных:
ID Date Points
1 1/11/2014 2
1 1/12/2014 4
1 1/1/2015 6
1 1/2/2015 8
2 1/11/2014 1
2 1/12/2014 2
2 1/1/2015 3
2 1/2/2015 4
Скажем, в примере структуры фрейма данных ID = int, Date = POSIXct, Points = int. Затем я конвертирую его в pdata.frame с идентификатором индекса и датой:
panel <- pdata.frame(dataframe, c("ID", "Date"))
И запустите регрессию с фиксированными эффектами plm:
fixed <- plm(Points ~ Date, data=panel, model="within")
summary(fixed)
Полученные в результате коэффициенты затем разбиваются по месяцам как фиктивные. Я хочу рассматривать свою временную переменную как непрерывную переменную, поэтому я получаю только один коэффициент для даты. Как я могу это сделать? Есть ли способ избежать форматирования переменной индекса времени как фактора в фреймах данных панели?