Я работаю с переменной для расы, которая принимает следующие значения: 1 черный, 2 латиноамериканец, 3 смешанная раса (не латиноамериканец), 4 не черный / не латиноамериканец. Я хочу суммировать 3 и 4 и сделать их базовой категорией, оставив темнокожих и испаноязычных. Я попытался создать 2 манекена (черный = 1 и другие испаноязычные = 1) и созданы 2 дополнительных столбца, но значения в них не 1
и 0
, а False
и True
. Код, который я использовал:
nlsy2$Hispanic <- nlsy2$Race==2
nlsy2$Black <- nlsy2$Race==1
nlsy2$Race [ nlsy2$Race == 0 ] <- 3
nlsy2$Race [ nlsy2$Race == 0 ] <- 4
Также, когда я запускаю summary(nlsy2$Hispanic)
, R дает мне следующий результат:
Mode FALSE TRUE NA's
logical 5594 1526 0
Есть проблемы с АН при запуске glm? Кроме того, если у вас есть лучшее решение для кода, как я могу перекодировать переменную гонки, это было бы очень полезно! Спасибо!
nlsy2$Hispanic <- (nlsy2$Race == 2) + 0
- person Adam Quek   schedule 24.04.2017levels
в R, см. [Ссылка] stackoverflow.com/questions/9604001/, и почему вам нужно преобразовывать в фиктивные для моделирования, а не использовать ихas.factor
? Для NA вы всегда можете включитьna.action = na.exclude
в свой код, и, основываясь на данных, вы всегда можете рассмотреть возможность вменения его с помощью пакетаmice
. - person Learner_seeker   schedule 24.04.2017