У меня есть набор данных обзора с НП в нескольких столбцах. Поэтому я решил выполнить множественное вменение с использованием пакета «missForest» для вменения пропущенных значений. Это не было проблемой, однако после проверки данных я заметил, что многие из вмененных значений являются числовыми с десятичными значениями в столбцах, которые ранее были факторами.
Я предполагаю, что missForest требует, чтобы столбцы были числовыми (для этого требуется data.matrix для x) для выполнения вменения.
NRMSE довольно хорош, и средние значения столбцов с вмененными значениями аналогичны столбцам с NA.
Я планирую использовать набор данных с вмененными значениями для многоуровневой линейной регрессии и в любом случае преобразовал бы столбцы факторов в числовые.
Должны ли эти условно исчисленные значения, являющиеся числовыми с десятичными знаками, представлять проблему?
finalmatrix <- data.matrix(final)
set.seed(666)
impforest <- missForest(finalmatrix, variablewise = TRUE, parallelize =
"forests")