Коррекция Ньюи Уэста и Уайта для линейной регрессии в R

Я действительно нуждаюсь в помощи

Я должен посмотреть, влияют ли праздники, особые дни и погода на мои ежедневные данные. Ежедневные данные имеют явно сезонный цикл.

Поэтому для этого я пытаюсь запустить линейную регрессию примерно с 1100 наблюдениями. Первым шагом было преобразование количества продаж, как описано в газетах, которые я читал.

Rt=Ln(Pt/Pt-1)*100

Где Pt — это продажи за сегодняшний день, а Pt-1 — за предыдущий день.

Чтобы учесть сезонность, у меня просто есть первая линейная регрессия, использующая день недели в качестве фиктивной переменной.

fit<- lm(log_return~D1+D3+D4+D5+D6+D7,data=mydata)

который с OLS дает следующий результат: Модельный график

Остатки ненормальны, график Q-Q показывает некоторые тяжелые ноги. Я думаю, это может быть связано с тем, что Остатки имеют значительную гетероскедачность и автокорреляцию.

Судя по документам, которые я читал, авторы всегда использовали Standard White и Newey West для коррекции гетероцедальности и автокорреляции в остатках. переменные, у меня есть обе проблемы, из-за которых мой OLS определенно ошибается.

Из документации sandwich для R похоже, что Newey West может автоматически находить нужное количество задержек, что для меня отлично, потому что я пробовал несколько ARMA(p,q ) варианты безуспешно.

Итак, теперь я запускаю vcovHAC(fit), я не совсем уверен, что это такое. Исправляет ли он мою проблему неизвестной автокорреляции и гетероскедатичности сам по себе полностью, также и с белым SE, и находит ли необходимые лаги, необходимые для исправления регрессии?

Как мне применить это к моей регрессии, чтобы получить такую ​​же сводку, как и сводка (соответствие), но с исправленными значениями в R, включая Rsquared? Это волшебным образом все исправляет? Каковы ограничения?

Большое спасибо, ребята


person Neon67    schedule 25.02.2018    source источник


Ответы (1)


Может быть, это может помочь:

person Socrates    schedule 06.03.2018
comment
Из первого примера. Мне неясно, получит ли y запаздывающую коррекцию или только x. Является ли Neweywest таким же, как vcovHAC без аргументов? Квадрат R не улучшается, график Q-Q и АКФ подгонки остаются неизменными, несмотря на коррекцию? Должен ли я добавлять задержки в регрессию, например lm(y ~ x + lag1y)? x ‹- sin(1:100) y ‹- 1 + x + rnorm(100) fm ‹- lm(y ~ x) vcovHAC(fm) vcov(fm) - person Neon67; 06.03.2018