Por que não usar Beta (1,1) como limite antes de um parâmetro de correlação transformado?

8

Na análise de dados bayesiana , capítulo 13, página 317, segundo parágrafo completo, nas aproximações modal e distributiva, Gelman et al. Escreva:

Se o plano é resumir a inferência pelo modo posterior de [o parâmetro de correlação em uma distribuição normal bivariada], substituiríamos a distribuição anterior U (-1,1) por , que é equivalente a um Beta (2,2) no parâmetro transformado . As densidades anteriores e resultantes são zero nos limites e, portanto, o modo posterior nunca será -1 ou 1. No entanto, ... a densidade anterior para é linear perto dos limites e, portanto, não contradiz nenhuma probabilidade.p ( ρ ) ( 1 - ρ ) ( 1 + ρ ) ρ + 1ρp(ρ)(1ρ)(1+ρ) ρρ+12ρ

Abaixo está um gráfico do PDF da distribuição Beta (2,2).

Gráfico em PDF de Beta (2,2)

Embora o gráfico seja fornecido para o domínio [0,1], a forma é a mesma para o domínio [-1,1] obtido ao realizar o inverso da transformação descrita na citação acima. Esta é uma distribuição bastante informativa! Dá cerca de sete vezes a densidade para do que para . Então, na verdade, seria contradizer a probabilidade que a probabilidade apontou para algo longe dos limites, mas mesmo mais longe . Um limite melhor para evitar antes seria Beta (1 + , 1 + ), onde . Tomemos, por exemplo, Beta (1.0001, 1.0001), plotado abaixo:ρ+1ρ+12=0.5ρ=0δδδ0ρ+12=0.3,0.97ρ=0δδδ0

Gráfico em PDF da versão Beta (1.0001,1.0001)

O problema com isso antes, é claro, é que a densidade cai muito perto de zero, o que pode contradizer a probabilidade de apontar para um espaço muito próximo de um limite. O que me leva à minha pergunta:

Por que não apenas definir o prior do parâmetro de correlação transformado como Beta (1,1)? Como a densidade da distribuição beta é zero para , isso é equivalente à distribuição uniforme no intervalo aberto (-1,1), em vez do intervalo fechado [-1, 1], e, portanto, não é um limite que evita o prior e não é preferível a um prior que coloque uma crença bastante forte na probabilidade de , que só é desejável se você realmente tiver essa crença?ρ=0ρ+12=0,1ρ=0

De um modo mais geral, o uso da distribuição beta, por definição, é um limite que evita antes porque seu suporte é ?0<ρ+12<1

Equilíbrio Brash
fonte

Respostas:

2

Nos casos em que a função de verossimilhança é maximizada em , o uso de Beta (1,1) em um intervalo aberto não ajuda, pois não há um modo posterior bem definido. Não há nenhum ponto no intervalo aberto que você possa dizer que é o modo posterior. ρ=-1

O livro deseja que o anterior seja linear nos limites, que seleciona exclusivamente Beta (2,2) de todas as distribuições Beta. Mas o livro nunca explica precisamente por que a linearidade é tão importante.

Tom Minka
fonte
E nunca discute os efeitos colaterais que descrevi na pergunta! Votou sua resposta, mas ainda não a verifiquei como definitiva. E eu desisti deste Q!
Brash Equilibrium