O que acontece quando você não tem uma idéia da distribuição de parâmetros? Que abordagem devemos usar?
Na maioria das vezes, pretendemos subestimar se uma determinada variável tem alguma influência sobre a presença / ausência de uma determinada espécie, e a variável é aceita ou não, de acordo com a importância da variável. Isso significa que na maioria das vezes não estamos pensando na distribuição expetcted que um parâmetro deve ter.
É correto assumir que todos os parâmetros seguem uma distribuição normal, quando tudo o que sei é que b1, b2, b3 e b4 devem variar entre -2 e 2 e b0 pode variar entre -5 e 5?
model {
# N observations
for (i in 1:N) {
species[i] ~ dbern(p[i])
logit(p[i]) <- b0 + b1*var1[i] + b2*var2[i] +
b3*var3[i] + b4*var4[i]
}
# Priors
b0 ~ dnorm(0,10)
b1 ~ dnorm(0,10)
b2 ~ dnorm(0,10)
b3 ~ dnorm(0,10)
b4 ~ dnorm(0,10)
}
Respostas:
Os parâmetros no preditor linear são distribuídos em t . Quando o número de registros chega ao infinito, converge para a distribuição normal. Então, sim, normalmente é considerado correto assumir a distribuição normal dos parâmetros.
De qualquer forma, nas estatísticas bayesianas, você não precisa assumir a distribuição de parâmetros. Normalmente você especifica os chamados anteriores não informativos . Para cada caso, diferentes anteriores não informativos são recomendados. Nesse caso, as pessoas costumam usar algo como (você pode ajustar os valores, é claro):
ou
O segundo é o preferido, porque não se limita a valores particulares. Com prévios pouco informativos, você não assume riscos. Obviamente, você pode limitá-los a um intervalo específico, mas tenha cuidado.
Então, você especifica o anterior não informativo e a distribuição dos parâmetros sai por si só! Não há necessidade de fazer suposições sobre isso.
fonte
dnorm(0, 1/10^10)
ou o que quer que sejaInfelizmente, antecedentes aparentemente inofensivos podem ser muito perigosos (e até enganaram alguns bayesianos experientes).
Este artigo recente fornece uma boa introdução, juntamente com métodos de plotagem para visualizar o anterior e o posterior (geralmente anteriores / posteriores marginais para o (s) parâmetro (s) de interesse).
Perigos ocultos da especificação de priores não informativos. John W. Seaman III, John W. Seaman Jr. e James D. Stamey The American StatisticianVolume 66, Edição 2, Maio de 2012, páginas 77-84. http://amstat.tandfonline.com/doi/full/10.1080/00031305.2012.695938
Esses gráficos, na minha opinião, devem ser obrigatórios em qualquer análise bayesiana real, mesmo que o analista não precise deles - o que está acontecendo em uma análise bayesiana deve ficar claro para a maioria dos leitores.
fonte
A análise de sensibilidade geralmente é um bom caminho a percorrer: tente diferentes anteriores e veja como seus resultados mudam com eles. Se eles forem robustos, você provavelmente conseguirá convencer muitas pessoas sobre seus resultados. Caso contrário, você provavelmente desejará quantificar de alguma forma como os anteriores alteram os resultados.
fonte