Na página 146 da Análise Bayesiana de Dados de Gelman, Gelman discute o valor p Bayesiano como uma maneira de verificar o ajuste do modelo. A idéia é comparar os dados observados ( ) com os dados que poderiam ter sido gerados pelo modelo se replicarmos o experimento ( ).
Ele define o valor p bayesiano como
Não entendo muito bem por que faz sentido que a estatística de teste seja uma função dos parâmetros . De fato, se o objetivo é "comparar os dados observados com os dados que poderiam ter sido gerados pelo modelo ", a comparação não deveria ser estritamente entre e ?
Por exemplo, na mesma página, Gelman fornece um exemplo em que ele verifica o ajuste de um modelo normal. A estatística do teste é:
onde é a média do modelo normal. Essa estatística de teste foi projetada para ignorar o ajuste do modelo na extremidade extrema, além das estatísticas de 6ª e 61ª ordem.
Por que não usamos a seguinte estatística de teste, contando apenas com os dados?
fonte