Jeffreys Prior para distribuição normal com média e variância desconhecidas

12

Estou lendo sobre distribuições anteriores e calculei Jeffreys antes para uma amostra de variáveis ​​aleatórias normalmente distribuídas com média e variação desconhecidas. De acordo com meus cálculos, o seguinte é válido para Jeffreys anterior: Aqui, sou a matriz de informações de Fisher.Eu

p(μ,σ2)=det(I)=det(1/σ2001/(2σ4))=12σ61σ3.
I

No entanto, também li publicações e documentos que declaram

  • p(μ,σ2)1/σ2 veja a Seção 2.2 em Kass e Wassermann (1996) .
  • p(μ,σ2)1/σ4 veja a página 25 em Yang e Berger (1998)

como Jeffreys antes, para o caso de uma distribuição normal com média e variância desconhecidas. Qual é o Jeffreys 'real' antes?

Nussig
fonte

Respostas:

7

Penso que a discrepância é explicada se os autores consideram a densidade sobre ou a densidade sobre . Apoiando essa interpretação, o que exatamente Kass e Wassermann escrevem é enquanto Yang e Berger escrevem σ 2 π ( μ , σ ) = 1 / σ 2 , π ( μ , σ 2 ) = 1 / σ 4 .σσ2

π(μ,σ)=1/σ2,
π(μ,σ2)=1/σ4.
A. Donda
fonte
2
Obrigado, eu esqueci isso. No entanto, isso ainda não explica a discrepância entre e . 1 / σ 41/σ31/σ4
Nussig
3
Na verdade, ter um prior de é o mesmo que ter um , devido à propriedade de reparametrização de Jeffreys anterior: com a matriz jacobiana de , ou seja, . π ( μ , σ 2 ) = 1 / σ 3 π ( μ , σ ) = π ( μ , σ 2 ) d e t ( J f ) 1π(μ,σ)=1/σ2π(μ,σ2)=1/σ3
π(μ,σ)=π(μ,σ2)det(Jf)1σ32σ1σ2
Jff:(μ,σ)(μ,σ2)
Jf=(10 00 02σ)
Nussig
3
@ Nussig, verifiquei o cálculo e acho que você está chegando ao ponto . Você também está certo de que a reparametrização equivale apenas a um fator . Considerando isso, seu cálculo está de acordo com Kass e Wassermann, e posso apenas supor que Yang e Berger cometeram um erro. Isso também faz sentido, já que o primeiro é um periódico revisado regularmente e o último é um rascunho de um tipo de coleção de fórmulas. 1/σ31/σ
A.Delda
3
Kass e Wassermann também observam que Jeffreys introduziu uma regra modificada, segundo a qual os parâmetros de localização e escala devem ser tratados separadamente. Isso leva a e, portanto, , mas ainda não a . π(μ,σ)=1/σπ(μ,σ2)=1/σ2π(μ,σ2)=1/σ4
A.Delda
2
Jim Berger ainda é um cientista ativo, de modo a ter certeza de que você pode verificar diretamente com ele: stat.duke.edu/~berger
A. Donda
4

As respostas existentes já respondem bem à pergunta original. Como físico, gostaria apenas de acrescentar a esta discussão um argumento de dimensionalidade. Se você considerar e para descrever a distribuição de uma variável aleatória em um espaço real 1D e medido em metros, eles têm as dimensões e . Para ter um prior fisicamente correto, você precisa ter as dimensões corretas, ou seja, os únicos poderes fisicamente possíveis de em um prior não paramétrico são: e .σ 2 [ μ ] ~ m [ σ 2 ] ~ m 2 σ π ( μ , σ ) ~ 1 / σ 2 π ( μ , σ 2 ) ~ 1 / σ 3μσ2[μ]m[σ2]m2σ

π(μ,σ)1/σ2
π(μ,σ2)1/σ3
Dr_Zaszuś
fonte
Por que existe na segunda expressão? σ3
cerebrou
3

11σ3 é o anterior de Jeffreys. No entanto, na prática, é frequentemente usado porque leva a um posterior relativamente simples, a "intuição" deste prior é que ele corresponde a um flat anterior em . log(σ)1σ2registro(σ)

Jorne Biccler
fonte
1
registro(σ)χ2
(μ,σ2)|DNχ-1(X¯,n,n,1n(XEu-X¯)2).
1/σ2χ2
1
χ2(X¯,n,n-1,s2)σ2χ2