Я пытаюсь заменить переменные категории фиктивными переменными. «сезон», «праздник», «рабочий день», «погода», «температура», «атем.», «влажность», «скорость ветра», «зарегистрированный», «счетчик», «час», «доу» - все переменные. .
Вот мой код:
#dummy
library(dummies)
#set up new dummy variables
data.new = data.frame(data)
data.new = cbind(data.new,dummy(data.new$season, sep = "_"))
data.new = cbind(data.new,dummy(data.new$holiday, sep = "_"))
data.new = cbind(data.new,dummy(data.new$weather, sep = "_"))
data.new = cbind(data.new,dummy(data.new$dow, sep = "_"))
data.new = cbind(data.new,dummy(data.new$hour, sep = "_"))
data.new = cbind(data.new,dummy(data.new$workingday, sep = "_"))
#delete the old variables
data.new = data.new[,-1]
data.new = data.new[,-1]
data.new = data.new[,-2]
data.new = data.new[,-8]
data.new = data.new[,-8]
data.new = data.new[,-1]
Должен ли я удалить старые переменные после создания фиктивных переменных? Если я хочу провести ПЦР, могу ли я использовать все переменные, например
fit = pcr(count~.,data = data.new)
создать модель линейной регрессии? Или мне просто использовать не фиктивные переменные?
fit = pcr(count~temp+atemp+humidity+windspeed+registered,data = data.new)
Извините за ваше недоразумение. В качестве примера я использовал функцию lm. Теперь я изменил его на функцию pcr. Спасибо, что прочитали этот вопрос!
dummy.data.frame
для создания фиктивных переменных в наборе данных. Удаление или неиспользование исходных переменных зависит от вас и от того, как вы собираетесь указать формулу. - person AntoniosK   schedule 14.12.2017?dummy.data.frame
- person AntoniosK   schedule 14.12.2017lm
автоматически генерирует для вас манекены, если ваши переменные являются символьными или факторными, поэтому нет необходимости создавать свои собственные манекены. Просто напишитеfit = lm(count~.,data = data.new)
без всехdummy
строк. - person acylam   schedule 14.12.2017