Considere a função de densidade posterior dada (como de costume) por com densidade anterior e distribuição do observações , condicionais no valor do parâmetro .
Sob certas condições, a distribuição posterior é assintoticamente normal (um resultado conhecido como teorema de Bernstein-von Mises, veja egvd Vaart, Asymptotic Statistics , Seção 10.2, para argumentos rigorosos, ou Young & Smith, Essentials of Statistical Inference , Seção 9.12. , para uma discussão informal.)
Existem exemplos (esperançosamente elementares) em que o posterior bayesiano não é assintoticamente normal? Em particular, existem exemplos em que
- e são continuamente diferenciável com respeito a ?
- para todos ?
Um exemplo que observei na literatura é que, onde são variáveis aleatórias independentes de Cauchy com o parâmetro de localização . Nesse caso, com probabilidade positiva, existem múltiplos máximos locais da função de verossimilhança (ver Young & Smith, exemplo 8.3). Talvez isso possa apresentar um problema no teorema B-vM, embora eu não tenha certeza.
Atualização: As condições suficientes para o BvM são (conforme indicado no vd Vaart, Seção 10.2):
os dados são obtidos da distribuição com o parâmetro fixo
o experimento é 'diferenciável em média quadrática' em com matriz de informações Fisher não singular
o prior é absolutamente contínuo em uma região em torno de
o modelo é contínuo e identificável
existe um teste que separa de para alguns
fonte
Respostas:
1.O exemplo de Cauchy contradiz o teorema de Bernstein von-Mises?
Não. O teorema de Bernstein von-Mises não é aplicável quando a distribuição conjunta não possui um segundo momento diferenciável. E obviamente as variáveis aleatórias conjuntas de Cauchy nem sequer têm um segundo momento finito. Essa condição requer uma suposição de energia limitada no coletor Riemanniano definida pela métrica Rao-Fisher que não é satisfeita por Cauchys.
2.Existem exemplos (esperançosamente elementares) em que o posterior bayesiano não é assintoticamente normal? Em particular, existem exemplos em que são continuamente diferenciáveis em relação a ? para todos ?π,f θ π(θ)>0 θ
Sim. De fato, podemos escolher um inadequado (não informativo), tornando o posterior também inadequado. Por exemplo, é um exemplo trivial. Um posterior inadequado não pode ser normal. Por exemplo, [Rubio & Steel] (14) forneceu um exemplo em que Jeffereys anterior conduzia a um posterior inadequado que não pode ser normal, não importando o tamanho do tamanho da amostra.π∝C0 f∝C1
Referência
[Rubio & Steel] Rubio, Francisco J. e Mark FJ Steel. "Inferência em modelos de escala de localização de duas peças com os anteriores de Jeffreys." Análise Bayesiana 9.1 (2014): 1-22.
fonte