Ошибка поезда каретки: по крайней мере один из уровней класса не является допустимым именем переменной R

я пытаюсь бежать

control = trainControl(
  method = "cv",
  number = 5,
  classProbs = TRUE,
  summaryFunction = twoClassSummary
  ) 

model_fit <-
  caret::train(
  Survived ~ .,
  data = train_cleaned_model_train,
  method = "glm",
  family = binomial(link = logit),
  preProc = c("knnImpute", "nzv"),
  metric = "ROC",
  trControl = control
  )

Имена для входных переменных выглядят нормально, как показано ниже.

Classes ‘tbl_df’, ‘tbl’ and 'data.frame':   534 obs. of  9 variables:
 $ PassengerId: int  71 744 353 636 436 433 687 329 95 193 ...
 $ Survived   : Factor w/ 2 levels "0","1": 1 1 1 2 2 2 1 2 1 2 ...
 $ Pclass     : int  2 3 3 2 1 2 3 3 3 3 ...
 $ Sex        : chr  "male" "male" "male" "female" ...
 $ Age        : num  32 24 15 28 14 42 14 31 59 19 ...
 $ SibSp      : int  0 1 1 0 1 1 4 1 0 1 ...
 $ Parch      : int  0 0 1 0 2 0 1 1 0 0 ...
 $ Fare       : num  10.5 16.1 7.23 13 120 ...
 $ Embarked   : chr  "S" "S" "C" "S" ...

Я видел другие вопросы по той же проблеме. У них в основном есть проблемы с именами переменных, которые начинаются либо со специальных символов, либо с цифр. Похоже, это не так.

Кто-нибудь может дать представление?


person Ravi Shankar Hela    schedule 05.02.2019    source источник


Ответы (1)


Я понял, что результаты должны быть закодированы как символьные переменные и не могут быть числовыми 1 или 0.

person Ravi Shankar Hela    schedule 05.02.2019