arviz.plot_ppc: апостериорное прогностическое среднее

введите здесь описание изображения введите здесь описание изображения

Привет!

После запуска модели простой модели линейной регрессии в pymc3 я пытаюсь построить график. Как вы можете видеть, оба графика показывают «апостериорную прогностическую среднюю оценку», но мне было интересно, могу ли я построить это распределение вокруг «апостериорной прогностической средней оценки» (а не вокруг «наблюдаемой оценки») в Арвизе, подобно тому, что показано на первом рисунке?

Оба рисунка сделаны по одним и тем же данным:

Score <- c(78.93,58.2,67.47,37.47,45.65,32.92,29.97)
Drugs <- c(1.17,2.97,3.26,4.69,5.83,6,6.41)

РЕДАКТИРОВАТЬ: Байесплот с границами: введите здесь описание изображения


person Nip    schedule 18.04.2020    source источник
comment
Не могли бы вы уточнить вопрос? Если я правильно понимаю легенду верхнего сюжета, y соответствует наблюдаемой оценке, а y_rep — апостериорной прогностической оценке. апостериорная прогностическая средняя оценка отсутствует. Его можно удалить с помощью az.plot_ppc(..., mean=False)   -  person OriolAbril    schedule 18.04.2020
comment
Предполагая, что вы используете данные для обоих графиков (что я и подозреваю), различия, которые вы видите, связаны с различиями в алгоритмах KDE. Поскольку доступны только 7 значений, присутствующих в Score, вывод всего PDF-файла затруднен. Подход ArviZ пытается сохранить наблюдаемые границы, поэтому KDE определяется только между минимальным и максимальным значениями в массиве наблюдаемых значений, а затем нормализуется. Если эти границы не соблюдаются (как это выглядит на байесовском графике), тогда KDE определяется за пределами указанных границ.   -  person OriolAbril    schedule 18.04.2020
comment
Принимая во внимание эти граничные эффекты (которые также влияют на нормализацию PDF), оба графика, похоже, показывают один и тот же результат.   -  person OriolAbril    schedule 18.04.2020
comment
@OriolAbril, как мне удалить границы в arviz.plot_ppc, если это возможно. Я не вижу пути в документации arviz-devs. github.io/arviz/generated/. Эти пределы легко добавить в байесплот с помощью Trim=T.   -  person Nip    schedule 18.04.2020
comment
В настоящее время это невозможно, поскольку мы считаем, что это плохая практика, которую не следует поощрять. Попытка угадать pdf за пределами диапазона наблюдаемых данных во многих ситуациях приводит к множеству проблем. При этом pdf, полученный с помощью методов kde, имеющих только 7 значений, как правило, не заслуживает доверия. Если вы используете ArviZ, я бы рекомендовал использовать plot_ppc(..., kind="scatter"). Я думаю, что это не отвечает на ваш вопрос: /, я надеюсь, что это было хотя бы немного информативно   -  person OriolAbril    schedule 21.04.2020