Diagnóstico residual em modelos de regressão baseados em MCMC

21

Recentemente, eu comecei a ajustar modelos mistos de regressão na estrutura bayesiana, usando um algoritmo MCMC (função MCMCglmm em R, na verdade).

Acredito ter entendido como diagnosticar a convergência do processo de estimativa (traço, gráfico de geweke, autocorrelação, distribuição posterior ...).

Uma das coisas que me impressiona na estrutura bayesiana é que parece haver muito esforço para realizar esses diagnósticos, enquanto muito pouco parece ser feito em termos de verificação dos resíduos do modelo ajustado. Por exemplo, no MCMCglmm, a função residual.mcmc () existe, mas ainda não está implementada (por exemplo, retornos: "resíduos ainda não implementados para objetos do MCMCglmm"; mesma história para predict.mcmc ()). Parece estar faltando em outros pacotes também, e geralmente é pouco discutido na literatura que encontrei (além do DIC, que também é bastante discutido).

Alguém poderia me indicar algumas referências úteis e, idealmente, o código R com o qual eu poderia brincar ou modificar?

Muito Obrigado.

Rossinante
fonte
Ótima pergunta. Eu realmente gosto do artigo de Andrew Gelman com Cosma Shalizi sobre a verificação de modelos bayesianos.
David J. Harris

Respostas:

7

Eu acho que o uso do termo residual não é consistente com a regressão bayesiana. Lembre-se, nos modelos de probabilidade freqüentes, são os parâmetros que são considerados quantidades estimadas fixas e o mecanismo de geração de dados tem algum modelo de probabilidade aleatória associado aos dados observados. Para os bayesianos, os parâmetros dos modelos de probabilidade são considerados variáveis ​​e os dados fixos atualizam nossa crença sobre quais são esses parâmetros. Portanto, se você estava calculando a variação dos valores ajustados menos observados em um modelo de regressão, o valor observadoO componente teria variação 0, enquanto o componente ajustado varia em função da densidade de probabilidade posterior para os parâmetros do modelo. Este é o oposto do que você derivaria do modelo de regressão freqüentista. Eu acho que se alguém estivesse interessado em verificar as suposições probabilísticas de seu modelo de regressão bayesiano, um gráfico QQ simples da densidade posterior das estimativas de parâmetros (estimada a partir de nossa amostra do MCMC) versus uma distribuição normal teria poder de diagnóstico análogo à análise de resíduos (ou resíduos de Pearson) para funções de link não lineares).

AdamO
fonte
1
Esta é uma boa resposta. Ainda pode haver respostas que dêem construções Bayesianas úteis calculadas a partir do residual observado menos ajustado, mas essa certamente não deveria ter sido prejudicada.
ely
3
Além disso, vale a pena esclarecer que, no cenário bayesiano, você realmente não possui valores "ajustados". Você pode calcular a média posterior para uma determinada entrada observada, para obter a estimativa máxima a posteriori do valor esperado da variável de destino nessa entrada. Mas isso reduziria tudo para apontar estimativas, o que geralmente não é desejado se você estiver fazendo inferência bayesiana.
ely
2
O @EMS é um desses resíduos significativos. Só porque alguém é bayesiano não significa que não se pode verificar se as suposições estão refletidas nos dados.
Glen_b -Reinstala Monica
1
Para inferência probabilística exata (suposições de normalidade em vigor) no cenário freqüentista, "resíduos", em repetições do experimento de estudo, seriam condicionalmente independentes do "valor ajustado" (ou média condicional). No mundo Bayes, os dados não são aleatórios, então o que seria condicionalmente independente do que?
Adamo
1
E[Y|X]XY