Por que o valor p bayesiano envolve os parâmetros além dos dados?

7

Na página 146 da Análise Bayesiana de Dados de Gelman, Gelman discute o valor p Bayesiano como uma maneira de verificar o ajuste do modelo. A idéia é comparar os dados observados ( ) com os dados que poderiam ter sido gerados pelo modelo se replicarmos o experimento ( ).yyrep

Ele define o valor p bayesiano como

pB=Pr(T(yrep,θ)T(y,θ)|y)

Não entendo muito bem por que faz sentido que a estatística de teste seja uma função dos parâmetros . De fato, se o objetivo é "comparar os dados observados com os dados que poderiam ter sido gerados pelo modelo ", a comparação não deveria ser estritamente entre e ?θyyrep

Por exemplo, na mesma página, Gelman fornece um exemplo em que ele verifica o ajuste de um modelo normal. A estatística do teste é:

T(y,θ)=|y(61)θ||y(6)θ|

onde é a média do modelo normal. Essa estatística de teste foi projetada para ignorar o ajuste do modelo na extremidade extrema, além das estatísticas de 6ª e 61ª ordem.θ

Por que não usamos a seguinte estatística de teste, contando apenas com os dados?

T(y,θ)=|y(61)y¯||y(6)y¯|
Heisenberg
fonte

Respostas:

0

Não há nada que o impeça de usar estatísticas de teste baseadas apenas nos dados replicados.

O ponto no exemplo é que o modelo assume que é normalmente distribuído em torno de uma média não está em torno de . Assim, a estatística de teste fornecida em Gelman et. al. testa algo sobre a suposição de normalidade, ao passo que não está realmente claro o que sua estatística de teste está testando.yEuθy¯

jaradniemi
fonte
3
Concordo que é 100% kosher usar estatísticas de teste baseadas apenas nos dados replicados. A questão é por que é kosher usar estatísticas de teste que envolvem os parâmetros do modelo? Conceitualmente, faz sentido que usemos o modelo para fazer algumas previsões e depois compará-las com a "verdade fundamental" observada . Não faz sentido que a comparação possa ser feita com , que envolve , que vem do modelo que queremos verificar em primeiro lugar. Parece circular para mim. T(y)T(y,θ)θ
Heisenberg