Как указать рандомные коэффициенты приоры в rstanarm?

Предположим, у меня есть следующая формула для модели смешанных эффектов:

Performance ~ 1 + WorkingHours + Tenure + (1 + WorkingHours + Tenure || JobClass)

то я могу указать априорные значения для фиксированных наклонов и фиксированного пересечения как:

prior = normal(c(mu1,mu2), c(sd1,sd2), autoscale = FALSE)
prior_intercept = normal(mean, scale, autoscale = FALSE)

Но как указать априорные значения для случайных наклонов и перехвата, используя

prior_covariance = decov(regularization, concentration, shape, scale)

(or)

lkj(regularization, scale, df)

если я знаю разницу между наклонами и пересечениями и корреляцию между ними. Я не могу понять, как указать параметры для приведенной выше формулы смешанных эффектов.


person Mukund Komati    schedule 15.06.2020    source источник


Ответы (1)


Поскольку вы работаете с байесовской моделью, вы не будете указывать корреляции или дисперсии. Вы собираетесь указать распределение правдоподобия ковариационных матриц (через корреляционную матрицу и вектор дисперсий), указав значения для нескольких параметров.

Параметр regularization представляет собой положительное действительное значение, определяющее вероятность корреляции вещей. Значение 1 является своего рода возможным вариантом (это значение по умолчанию). Значения больше 1 означают, что вы считаете, что корреляций мало, если они вообще есть. Значения меньше 1 означают, что вы считаете, что существует большая корреляция.

Параметр scale связан с суммой отклонений. В частности, параметр масштаба равен квадратному корню из средней дисперсии.

Параметр concentration используется для управления распределением общей дисперсии между различными переменными. Значение 1 означает, что у вас нет ожиданий. Большие значения говорят о том, что вы считаете, что переменные имеют одинаковые доли общей дисперсии. Значения от 0 до 1 означают, что вы считаете, что есть разные вклады.

Параметр shape используется для гамма-распределения, которое действует как априорное для scale.

Затем, наконец, df — ваши предыдущие степени свободы.

Таким образом, decov и lkj дают вам разные способы выразить ваши ожидания относительно свойств ковариационной матрицы, но они не позволяют указать, какие конкретные переменные, по вашему мнению, коррелируют с какими другими конкретными переменными. Он должен решить это как часть процесса подбора модели.

Все это взято из документации rstanarm.

person AColeman    schedule 23.06.2020