Я действительно нуждаюсь в помощи
Я должен посмотреть, влияют ли праздники, особые дни и погода на мои ежедневные данные. Ежедневные данные имеют явно сезонный цикл.
Поэтому для этого я пытаюсь запустить линейную регрессию примерно с 1100 наблюдениями. Первым шагом было преобразование количества продаж, как описано в газетах, которые я читал.
Rt=Ln(Pt/Pt-1)*100
Где Pt — это продажи за сегодняшний день, а Pt-1 — за предыдущий день.
Чтобы учесть сезонность, у меня просто есть первая линейная регрессия, использующая день недели в качестве фиктивной переменной.
fit<- lm(log_return~D1+D3+D4+D5+D6+D7,data=mydata)
который с OLS дает следующий результат: Модельный график
Остатки ненормальны, график Q-Q показывает некоторые тяжелые ноги. Я думаю, это может быть связано с тем, что Остатки имеют значительную гетероскедачность и автокорреляцию.
Судя по документам, которые я читал, авторы всегда использовали Standard White и Newey West для коррекции гетероцедальности и автокорреляции в остатках. переменные, у меня есть обе проблемы, из-за которых мой OLS определенно ошибается.
Из документации sandwich для R похоже, что Newey West может автоматически находить нужное количество задержек, что для меня отлично, потому что я пробовал несколько ARMA(p,q ) варианты безуспешно.
Итак, теперь я запускаю vcovHAC(fit), я не совсем уверен, что это такое. Исправляет ли он мою проблему неизвестной автокорреляции и гетероскедатичности сам по себе полностью, также и с белым SE, и находит ли необходимые лаги, необходимые для исправления регрессии?
Как мне применить это к моей регрессии, чтобы получить такую же сводку, как и сводка (соответствие), но с исправленными значениями в R, включая Rsquared? Это волшебным образом все исправляет? Каковы ограничения?
Большое спасибо, ребята