Проблемы из-за слишком большого количества отдельных блоков питания на первом этапе

Я рассчитываю распространенность антропометрических отказов для 25 стран с помощью r-studio и опроса пакетов. Для 24 стран это сработало нормально. Но для Индии я получаю нелогичные ценности. Я получаю показатель распространенности недостаточного веса для Индии в 2016 году в размере 20,8% (18,4% -23,1%), согласно statcompiler, это должно быть 35,7%. Когда я вычисляю это вручную, я получаю значение 34,8%, однако мне нужна стандартная ошибка для моего анализа, поэтому я должен рассмотреть сложный план исследования с опросом пакетов в R. Я получаю сообщение об ошибке: Ошибка в одной странице (x [индекс,, drop = FALSE], кластеры [индекс], nPSU [index] [1],: Stratum (5610) имеет только один PSU на этапе 1,

Сначала я пробовал разные вещи. Я вручную исключил наблюдения, для которых был доступен только один блок питания на этапе 1, а затем попробовал параметры команды (survey.lonely.psu = "remove") (я также пробовал "отрегулировать" и "усреднить") ). Первый подход дает мне даже худшие результаты, чем подход lonely.psu.

IN16_final<- IN16_final[ which(IN16_final$waz<+5 & IN16_final$waz >= -6),]

# categorize underweight in children 
IN16_final$Category[IN16_final$waz <=-3                                      ] = "2"#severly underweight"
IN16_final$Category[IN16_final$waz <= -2 & IN16_final$waz >= -3] = "1"#moderately underweight"
IN16_final$Category[IN16_final$waz >-2                                       ] = "0"#not underweight"

#dummy for underweight or not underweight
IN16_final$wazcat<-ifelse(IN16_final$waz>=-2,0,1)# 0 not underweight, 1 underweight


#manual exclusion of values that have only one obs for PSU stage 1
IN16_final<- IN16_final[IN16_final$v023 != "912",]

#alternative
options(survey.lonely.psu="remove")

#result for India 2016
                      mean     SE
#underweight_prevalence 0.20776 0.0119 


person Mt Mona    schedule 03.05.2019    source источник
comment
возможно использовать options(survey.lonely.psu="adjust")   -  person Anthony Damico    schedule 04.05.2019
comment
Привет, спасибо за ответ! Но, как я уже писал, я уже пробовал регулировать и усреднять. Каким-то образом, если я не включаю веса в план опроса, я получаю официальные результаты.   -  person Mt Mona    schedule 05.05.2019


Ответы (1)


Это довольно старый пост, надеюсь, вы уже нашли обходной путь.
Сегодня у меня был тот же вопрос, и для меня это сработало:

options(survey.adjust.domain.lonely=TRUE)
options(survey.lonely.psu="adjust")

источник:
https://r-survey.r-forge.r-project.org/survey/exmample-lonely.html.

person Anneke van der Reijden    schedule 07.12.2020