Por que um anterior à variância é considerado fraco?

21

fundo

Um dos pontos fracos mais comumente usados ​​antes da variância é a gama inversa com os parâmetros (Gelman 2006) .α=0.001,β=0.001

No entanto, essa distribuição possui um IC de 90% de aproximadamente .[3×1019,]

library(pscl)
sapply(c(0.05, 0.95), function(x) qigamma(x, 0.001, 0.001))

[1] 3.362941e+19          Inf

A partir disso, interpreto que o oferece uma baixa probabilidade de que a variação seja muito alta e a probabilidade muito baixa de que a variação seja menor que 1 .P ( σ < 1 | α = 0,001 , β = 0,001 ) = 0,006IG(0.001,0.001)P(σ<1|α=0.001,β=0.001)=0.006

pigamma(1, 0.001, 0.001)
[1] 0.006312353

Questão

Estou faltando alguma coisa ou isso é realmente um prévio informativo?

atualização para esclarecer, a razão pela qual eu estava considerando isso 'informativo' é porque afirma fortemente que a variação é enorme e muito além da escala de quase qualquer variação já medida.

acompanhamento uma meta-análise de um grande número de estimativas de variância forneceria um prazo mais razoável antes?


Referência

Gelman 2006. Distribuições anteriores para parâmetros de variância em modelos hierárquicos . Análise Bayesiana 1 (3): 515-533

David LeBauer
fonte
1
Um prior não informativo "verdadeiro" não é uma distribuição. Portanto, não há probabilidade anterior, como P (sigma <1).
Stéphane Laurent

Respostas:

38

Usando a distribuição gama inversa, obtemos:

p(σ2|α,β)(σ2)-α-1exp(-βσ2)

Você pode ver facilmente que, se e α 0 , a gama inversa se aproximará dos Jeffreys antes. Essa distribuição é denominada "não informativa" porque é uma aproximação adequada aos Jeffreys anteriores.β0 0α0 0

p(σ2)1σ2

O que não é informativo para os parâmetros de escala, veja a página 18 aqui, por exemplo , porque esse anterior é o único que permanece invariante sob uma mudança de escala (observe que a aproximação não é invariante). Isso possui uma integral indefinida de que mostra que é inadequado se o intervalo de σ 2 incluir 0 ou . Mas esses casos são apenas problemas na matemática - não no mundo real. Nunca observe realmente o valor infinito da variação e, se a variação observada for zero, você terá dados perfeitos !. Para você pode definir um limite inferior igual a L > 0 e o limite superior igual a Uregistro(σ2)σ20 0eu>0 0 , e sua distribuição é adequada.você<

Embora possa parecer estranho que isso seja "pouco informativo", na medida em que prefere pequena variação a grande, mas isso é apenas em uma escala. Você pode mostrar que o tem uma distribuição uniforme incorreta. Portanto, este prioritário não favorece nenhuma escala sobre nenhuma outraregistro(σ2)

Embora não esteja diretamente relacionado à sua pergunta, eu sugeriria uma distribuição não informativa "melhor" escolhendo os limites superior e inferior e U nos Jeffreys anteriores, em vez de α e β . Geralmente, os limites podem ser definidos facilmente com um pouco de reflexão sobre o que σ 2 realmente significa no mundo real. Se foi o erro em algum tipo de quantidade física - L não pode ser menor que o tamanho de um átomo ou o menor tamanho que você pode observar em seu experimento. U adicionaleuvocêαβσ2euvocênão poderia ser maior que a terra (ou o sol, se você quisesse ser realmente conservador). Desta forma, você manter suas propriedades de invariância, e sua uma prévia mais fácil de amostra: take , e em seguida, o valor simulado como σ 2 ( b ) = exp ( q ( b ) ) .q(b)vocênEuform(registro(eu),registro(você))σ(b)2=exp(q(b))

probabilityislogic
fonte
5
+1 por não apenas responder à pergunta, mas também fornecer conselhos úteis.
whuber
euog(σ)
Betuma2(1,1)F1,1Betuma2(0 0,0 0)
probabilityislogic
1
[0 0,]σexp(você(euog(eu),euog(você))σvocê(eu,você)
David LeBauer
(0 0,)α=1,β=1/2
10

É bem perto do apartamento. Sua mediana é de 1,9 E298, quase o maior número que se pode representar em aritmética flutuante de precisão dupla. Como você aponta, a probabilidade que ele atribui a qualquer intervalo que não seja realmente grande é muito pequena. É difícil ser menos informativo do que isso!

whuber
fonte
Obrigado pela sua explicação. Eu estou enfrentando problemas de convergência e fiquei surpreso que muitas das variáveis ​​com as quais trabalho têm médias sejam <1000 (ou seja, se algo for> 1000 g, é medido em kg), e as variações estão na mesma ordem de magnitude. Portanto, estou percebendo que preciso de mais antecedentes que incorporem essas informações, mesmo que eu realmente não tenha um bom conhecimento prévio de seu valor ou de como elas são particionadas.
David LeBauer
Dependendo do modelo, o seu posterior pode estar muito perto de imprópria utilizando este antes
JMS