Na análise de dados bayesiana , capítulo 13, página 317, segundo parágrafo completo, nas aproximações modal e distributiva, Gelman et al. Escreva:
Se o plano é resumir a inferência pelo modo posterior de [o parâmetro de correlação em uma distribuição normal bivariada], substituiríamos a distribuição anterior U (-1,1) por , que é equivalente a um Beta (2,2) no parâmetro transformado . As densidades anteriores e resultantes são zero nos limites e, portanto, o modo posterior nunca será -1 ou 1. No entanto, ... a densidade anterior para é linear perto dos limites e, portanto, não contradiz nenhuma probabilidade.p ( ρ ) ∝ ( 1 - ρ ) ( 1 + ρ ) ρ + 1 ρ
Abaixo está um gráfico do PDF da distribuição Beta (2,2).
Embora o gráfico seja fornecido para o domínio [0,1], a forma é a mesma para o domínio [-1,1] obtido ao realizar o inverso da transformação descrita na citação acima. Esta é uma distribuição bastante informativa! Dá cerca de sete vezes a densidade para do que para . Então, na verdade, seria contradizer a probabilidade que a probabilidade apontou para algo longe dos limites, mas mesmo mais longe . Um limite melhor para evitar antes seria Beta (1 + , 1 + ), onde . Tomemos, por exemplo, Beta (1.0001, 1.0001), plotado abaixo:ρ+1ρ=0δδδ→0
O problema com isso antes, é claro, é que a densidade cai muito perto de zero, o que pode contradizer a probabilidade de apontar para um espaço muito próximo de um limite. O que me leva à minha pergunta:
Por que não apenas definir o prior do parâmetro de correlação transformado como Beta (1,1)? Como a densidade da distribuição beta é zero para , isso é equivalente à distribuição uniforme no intervalo aberto (-1,1), em vez do intervalo fechado [-1, 1], e, portanto, não é um limite que evita o prior e não é preferível a um prior que coloque uma crença bastante forte na probabilidade de , que só é desejável se você realmente tiver essa crença?ρ=0
De um modo mais geral, o uso da distribuição beta, por definição, é um limite que evita antes porque seu suporte é ?