Ошибка выборки - базовая модель регрессии в стандарте Stan

Я пытаюсь выучить Стэна и решаю несколько заведомо простых задач, чтобы быстро освоиться. Я очень сильно застрял на уровне 1, пытаясь запустить простую двумерную регрессию.

У меня есть данные следующего формата

stan_data <- list("y"=y, 
                  "year"=year,
                  "N_obs" = N_obs)

Полные данные вставлены в конец этого поста.

Во всяком случае, мой стандартный код для двумерной регрессии выглядит так.

lm <- "data {
            int<lower=1> N_obs;      
            real year[N_obs];
            real y[N_obs];
            }
        parameters {
            real alpha;
            real beta;
            real<lower=0> sigma;
         } 

         transformed parameters{ 
         }

         model {
             vector[N_obs] mu_hat;

             alpha ~ normal(0, 100);
             beta ~ normal(0, 100);
             sigma ~ uniform(0, 100);

             for(i in 1:N_obs){
                 mu_hat[i] <- alpha + beta * year[i];
                 y[i] ~ normal(mu_hat[i], sigma);
             }
        }"


write(lm, file="lm.stan")


lm.fit0 <- stan(file="lm.stan",
            data=stan_data, 
            chains=1, 
            iter=5000)

Во-первых, у меня вопрос. Почему у нас есть инструкция в блоке модели vector[N_obs] mu_hat; (вместо real mu_hat[N_obs]; в блоке преобразованных параметров)? Немного погуглив, кажется, что это то, что вам нужно сделать.

Во-вторых (что более серьезно), когда я пытаюсь запустить код, я получаю следующую ошибку:

TRANSLATING MODEL 'lm' FROM Stan CODE TO C++ CODE NOW.
COMPILING THE C++ CODE FOR MODEL 'lm' NOW.
SAMPLING FOR MODEL 'lm' NOW (CHAIN 1).
Error : Error in function stan::prob::normal_log(d): Random variable is nan, but must not be nan!
In addition: Warning message:
In storage.mode(x) <- "integer" : NAs introduced by coercion
error occurred during calling the sampler; sampling not done

Как обычно, любая помощь приветствуется.

Фактически данные выглядят так:

См. https://groups.google.com/d/msg/stan-users/fsM8GPG4cpM/YVedcWYcmW8J

$year
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4
4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4
4 4 4 4 4 4 4 4 4 4 4 4

$N_obs
284

person user1519289    schedule 22.02.2013    source источник
comment
В вашем первом запросе mu можно объявить как вектор (как вы это сделали) или как одномерный массив (как вы предполагали). В вашем примере это не имеет значения. В общем, векторы можно использовать для операций линейной алгебры, тогда как массивы - нет.   -  person user1519289    schedule 22.02.2013
comment
stan_data $ у 42089728 9339536 9781184 138361088 30910448 30411792 629997056 21062368 1167006 7631744 6925444 5893008 35743680 -55904 116299776 966712 178152 19397504 101188992 1536242176 44078264 1243806 105937664 43202352 -4213172 40201728 84412544 16671128 19432968 44403296 0 89021120 33442736 5850532 68061664 0 86286272 636771072 65779408 6416524 25559184 0 0 11437649 128506560 26867136 1646992 -16684608 43974528 6812660 0 0 -906249 17730360 6571846 -14056304 -2317026 29722656 43035904 24308224 70388248 -202987 0 19598944 25241600 31093140 172198080 68365824 345229424 -15307088 0 91912288 6387084 6936104 34233728 362958976 10828080 465616896 185831488 4554222 14789792 19448168 27692960 88308096 75171 -246307584 11228152 552 8361832 2265296 172424512 1182046720 22629408 1165429 348064512 77001792 11092408 84706848 66124424 -19970752 -2386432 19266104 72069984 14311872 -1680048 509040 188740112 318636288 170175680 -244937216 16264160 6017916 327072 159117760 0 8156479 320665728 36684736 17502416 29556064 47395008 12937934 168051632 0 +892982 10329560 1355983 -4529648 - 43117 -10704432 226641152 23704368 -3433973 -73329408 0 3594688 51327088 59915116 293390016 382384192 -12102624 -24685504 0 -336263424 -899952 10155976 218019584 48748112 30058752 44083792 1842414592 5092000 24174848 10985128 33436544 159885024 36513376 140204416 12631560 8951732 25929808 353803264 60253136 3143784448 702773 506841344 38420128 11721112 92972608 60845840 30016168 37990192-6470864 78 287520 21554528 29755168 3766984 35639136 26794784 583849280 267967488 37916960 11501600 22704880 133042624 513627 3389580 289430272 21665616 85471472 39646656 116267616 -13407846 15678080 27691000 682450 9635360 580544 16791136 793524 38486832 -79701376 -63242544 2160139 202091584 300 60001872 120758144 50716744 13548672 623414144 21202400 0 0 17696512 -5566584 -3197064 201575680 34187360 50923296 1267788800 28845072 1021406 20589376 5255816 19726800 43046336 84012320 93750016 1549232 4102708 20721248 36500736 5098330112 -20425392 781041 247644672 28292416 21682296 52508672 38884352 57993648 953560 1437008 81498304 86611584 23846608 5454052 37785760 99136512 58742016 37354624 14447532 1308937472 19370288 81054432 108383989 5834392 196654592 -37886048 199 787840 -38083360 -19815904 1496112 7065456 30429000 -190947 3102040 5150997 6569152 711859 42429536 148236256 70894720 -888473 62231296 15503290 -17289808 106739712 -46661260 -2047850000 94661116 60947850000 9466111660 -2047850000   -  person Ben Goodrich    schedule 23.02.2013


Ответы (1)


Короче говоря, это ошибка в RStan, который пытался преобразовать модель хранения целочисленных данных в целочисленные. Но здесь целое число настолько велико, что создаются некоторые NA. Будет исправлено в следующем выпуске.

Обновите, чтобы сказать, я думаю, что проблема может быть не в моем коде. Когда я провожу анализ части своего набора данных, выбирая первые 150 наблюдений, он работает нормально. Когда я пытаюсь сделать это со всем своим набором данных, он взрывается. Тем не менее, мне кажется, что мои данные сформированы правильно, поэтому я буду очень признателен за любое понимание этого.

person J Guo    schedule 22.02.2013