Recentemente, eu comecei a ajustar modelos mistos de regressão na estrutura bayesiana, usando um algoritmo MCMC (função MCMCglmm em R, na verdade).
Acredito ter entendido como diagnosticar a convergência do processo de estimativa (traço, gráfico de geweke, autocorrelação, distribuição posterior ...).
Uma das coisas que me impressiona na estrutura bayesiana é que parece haver muito esforço para realizar esses diagnósticos, enquanto muito pouco parece ser feito em termos de verificação dos resíduos do modelo ajustado. Por exemplo, no MCMCglmm, a função residual.mcmc () existe, mas ainda não está implementada (por exemplo, retornos: "resíduos ainda não implementados para objetos do MCMCglmm"; mesma história para predict.mcmc ()). Parece estar faltando em outros pacotes também, e geralmente é pouco discutido na literatura que encontrei (além do DIC, que também é bastante discutido).
Alguém poderia me indicar algumas referências úteis e, idealmente, o código R com o qual eu poderia brincar ou modificar?
Muito Obrigado.
Respostas:
Eu acho que o uso do termo residual não é consistente com a regressão bayesiana. Lembre-se, nos modelos de probabilidade freqüentes, são os parâmetros que são considerados quantidades estimadas fixas e o mecanismo de geração de dados tem algum modelo de probabilidade aleatória associado aos dados observados. Para os bayesianos, os parâmetros dos modelos de probabilidade são considerados variáveis e os dados fixos atualizam nossa crença sobre quais são esses parâmetros. Portanto, se você estava calculando a variação dos valores ajustados menos observados em um modelo de regressão, o valor observadoO componente teria variação 0, enquanto o componente ajustado varia em função da densidade de probabilidade posterior para os parâmetros do modelo. Este é o oposto do que você derivaria do modelo de regressão freqüentista. Eu acho que se alguém estivesse interessado em verificar as suposições probabilísticas de seu modelo de regressão bayesiano, um gráfico QQ simples da densidade posterior das estimativas de parâmetros (estimada a partir de nossa amostra do MCMC) versus uma distribuição normal teria poder de diagnóstico análogo à análise de resíduos (ou resíduos de Pearson) para funções de link não lineares).
fonte