Я очень новичок в R (в основном программирую на SQL), но столкнулся с проблемой, с которой SQL не мог мне помочь. Ниже я попытаюсь упростить задачу.
Предположим, у меня есть набор данных из 100 строк, где каждая строка имеет свой вес. Из этих 100 строк данных 5 имеют значение X, которое имеет верхний код 1000. Также предположим, что X может быть представлено линейным уравнением X ~ Y + Z + U + 0 (нужно положительное значение, поэтому я не не хочу Y-перехвата).
Теперь, не принимая во внимание веса каждой строки данных, формула, которую я использовал в R, была следующей:
fit = censReg(X ~ Y + Z + U + 0, left = -Inf, right = 1000, data = dataset)
Если бы я вычислил summary(fit)
, я бы получил 0 значений с цензурой слева, 95 значений без цензуры и 5 значений с цензурой справа, что именно то, что я хочу, за вычетом того факта, что веса не были добавлены в смесь в достаточной степени. Я проверил справочное руководство по функции censReg
, и похоже, что она не принимает аргумент веса.
Есть ли что-то, что я упускаю из виду в функции censReg
, или есть другая функция, которая могла бы мне пригодиться? Моя конечная цель — оценить X в тех случаях, когда оно подвергается цензуре (т. е. в 5 случаях, когда оно равно 1000).