У меня есть набор данных с категориальной переменной с уродливым количеством уровней (5000 или около того). Когда я запустил свой код для преобразования в фиктивные переменные, он сказал, что ему нужно 22 гигабайта памяти и вылетает
dmy <- dummyVars(" ~ .", data = num_data)
new_data <- data.frame(predict(dmy, newdata = num_data))
Что мне делать в этом случае? Выбираете облачное решение? Попробуйте оптимизировать функции?
caret
? - person Ben Bolker   schedule 03.11.2015glmnet
с функциейcv.glmnet
, поддерживающей разреженный ввод. - person Marcin Kosiński   schedule 04.11.2015