Взвешенная цензурированная регрессия в R?

Я очень новичок в R (в основном программирую на SQL), но столкнулся с проблемой, с которой SQL не мог мне помочь. Ниже я попытаюсь упростить задачу.

Предположим, у меня есть набор данных из 100 строк, где каждая строка имеет свой вес. Из этих 100 строк данных 5 имеют значение X, которое имеет верхний код 1000. Также предположим, что X может быть представлено линейным уравнением X ~ Y + Z + U + 0 (нужно положительное значение, поэтому я не не хочу Y-перехвата).

Теперь, не принимая во внимание веса каждой строки данных, формула, которую я использовал в R, была следующей:

fit = censReg(X ~ Y + Z + U + 0, left = -Inf, right = 1000, data = dataset)

Если бы я вычислил summary(fit), я бы получил 0 значений с цензурой слева, 95 значений без цензуры и 5 значений с цензурой справа, что именно то, что я хочу, за вычетом того факта, что веса не были добавлены в смесь в достаточной степени. Я проверил справочное руководство по функции censReg, и похоже, что она не принимает аргумент веса.

Есть ли что-то, что я упускаю из виду в функции censReg, или есть другая функция, которая могла бы мне пригодиться? Моя конечная цель — оценить X в тех случаях, когда оно подвергается цензуре (т. е. в 5 случаях, когда оно равно 1000).


person Community    schedule 10.03.2015    source источник


Ответы (1)


В этой ситуации вам следует использовать регрессию Тобита, она разработана специально для линейного моделирования скрытых переменных, таких как та, которую вы описываете.

Регрессия учитывает ваши веса и цензурированные наблюдения, которые можно увидеть в выводе логарифмической функции правдоподобия для Тобита типа I (верхняя и нижняя границы).

Тобит-регрессию можно найти в пакете VGAM, используя функцию vglm с управляющим параметром tobit. Отличный пример можно найти здесь:

http://www.ats.ucla.edu/stat/r/dae/tobit.htm

person mlegge    schedule 10.03.2015
comment
Если это моя формула fit = vglm(formula = X ~ Y + Z + U, family = tobit(Upper = 1000), data = dataset, weights = WGTP), будет ли регрессия Torbit давать только значения ›= 1000 для 5 подвергнутых цензуре наблюдений? - person ; 10.03.2015
comment
Я не могу дать полную гарантию, это зависит от ваших данных и весов... Используйте свою модель, чтобы найти подходящие значения y для 5 подвергнутых цензуре наблюдений, чтобы точно увидеть, какие значения они принимают. - person mlegge; 10.03.2015