Winbugs e outros MCMC sem informações para distribuição prévia

10

O que acontece quando você não tem uma idéia da distribuição de parâmetros? Que abordagem devemos usar?

Na maioria das vezes, pretendemos subestimar se uma determinada variável tem alguma influência sobre a presença / ausência de uma determinada espécie, e a variável é aceita ou não, de acordo com a importância da variável. Isso significa que na maioria das vezes não estamos pensando na distribuição expetcted que um parâmetro deve ter.

É correto assumir que todos os parâmetros seguem uma distribuição normal, quando tudo o que sei é que b1, b2, b3 e b4 devem variar entre -2 e 2 e b0 pode variar entre -5 e 5?

model {
    # N observations
    for (i in 1:N) {
        species[i] ~ dbern(p[i])
        logit(p[i]) <- b0 + b1*var1[i] + b2*var2[i] + 
            b3*var3[i] + b4*var4[i]
    }
    # Priors
    b0     ~ dnorm(0,10)
    b1   ~ dnorm(0,10)
    b2 ~ dnorm(0,10)
    b3  ~ dnorm(0,10)
    b4  ~ dnorm(0,10)
}
Gago-Silva
fonte
Se você não possui um antecedente, não pode usar a inferência bayesiana. E, portanto, metodologia MCMC,
Xi'an

Respostas:

6

Os parâmetros no preditor linear são distribuídos em t . Quando o número de registros chega ao infinito, converge para a distribuição normal. Então, sim, normalmente é considerado correto assumir a distribuição normal dos parâmetros.

De qualquer forma, nas estatísticas bayesianas, você não precisa assumir a distribuição de parâmetros. Normalmente você especifica os chamados anteriores não informativos . Para cada caso, diferentes anteriores não informativos são recomendados. Nesse caso, as pessoas costumam usar algo como (você pode ajustar os valores, é claro):

dunif(-100000, 100000)

ou

dnorm(0, 1/10^10)

O segundo é o preferido, porque não se limita a valores particulares. Com prévios pouco informativos, você não assume riscos. Obviamente, você pode limitá-los a um intervalo específico, mas tenha cuidado.

Então, você especifica o anterior não informativo e a distribuição dos parâmetros sai por si só! Não há necessidade de fazer suposições sobre isso.

Curioso
fonte
11
Infelizmente, isso não é exatamente verdade: os limites do uniforme anterior acima podem influenciar o resultado, esp. ao testar hipóteses. Esta é uma desvantagem do Winbugs na minha opinião.
Xi'an
@ Xi'an - é claro, é o que eu digo. É por isso que eu prefiro o "normal normal" neste caso - ou seja, a segunda opção. Possivelmente com o ajuste do segundo parâmetro.
Curioso
11
Hmmm, este não é um plano antes de tudo ...
Xian
Você é livre para usar dnorm(0, 1/10^10)ou o que quer que seja
Curioso
8

Infelizmente, antecedentes aparentemente inofensivos podem ser muito perigosos (e até enganaram alguns bayesianos experientes).

Este artigo recente fornece uma boa introdução, juntamente com métodos de plotagem para visualizar o anterior e o posterior (geralmente anteriores / posteriores marginais para o (s) parâmetro (s) de interesse).

Perigos ocultos da especificação de priores não informativos. John W. Seaman III, John W. Seaman Jr. e James D. Stamey The American StatisticianVolume 66, Edição 2, Maio de 2012, páginas 77-84. http://amstat.tandfonline.com/doi/full/10.1080/00031305.2012.695938

Esses gráficos, na minha opinião, devem ser obrigatórios em qualquer análise bayesiana real, mesmo que o analista não precise deles - o que está acontecendo em uma análise bayesiana deve ficar claro para a maioria dos leitores.

phaneron
fonte
2
bom link, é uma pena que ele não esteja disponível gratuitamente.
Curioso
6

A análise de sensibilidade geralmente é um bom caminho a percorrer: tente diferentes anteriores e veja como seus resultados mudam com eles. Se eles forem robustos, você provavelmente conseguirá convencer muitas pessoas sobre seus resultados. Caso contrário, você provavelmente desejará quantificar de alguma forma como os anteriores alteram os resultados.

loucura
fonte