Estou investigando um método para verificação automática dos métodos Monte Carlo da cadeia de Markov e gostaria de alguns exemplos de erros que podem ocorrer ao construir ou implementar esses algoritmos. Pontos de bônus se o método incorreto foi usado em um artigo publicado.
Estou particularmente interessado nos casos em que o erro significa que a cadeia tem a distribuição invariável incorreta, embora outros tipos de erros (por exemplo, cadeia não ergódica) também sejam interessantes.
Um exemplo desse erro seria não gerar um valor quando Metropolis-Hastings rejeitar uma mudança proposta.
Respostas:
1. Estimador marginal de verossimilhança e média harmônica
A probabilidade marginal é definida como a constante de normalização da distribuição posterior
A importância dessa quantidade vem do papel que ela desempenha na comparação de modelos via fatores Bayes .
Vários métodos foram propostos para aproximar essa quantidade. Raftery et al. (2007) propõem o estimador de média harmônica , que rapidamente se tornou popular devido à sua simplicidade. A ideia consiste em usar a relação
Portanto, se temos uma amostra a partir do posterior, dizer , esta quantidade pode ser aproximada pela( θ1, . . . , θN)
Essa aproximação está relacionada ao conceito de amostragem por importância .
Pela lei de grandes números, como discutido no blog de Neal , temos que esse estimador seja consistente . O problema é que o necessário para uma boa aproximação pode ser enorme. Veja o blog de Neal ou o blog de Robert 1 , 2 , 3 , 4 para alguns exemplos.N
Alternativas
Existem muitas alternativas para aproximar . Chopin e Robert (2008) apresentam alguns métodos baseados em amostragem Importance.p ( x )
2. Não executando o amostrador MCMC por tempo suficiente (especialmente na presença de multimodalidade)
Mendoza e Gutierrez-Peña (1999) deduzem a referência anterior / posterior para a razão de duas médias normais e apresentam um exemplo das inferências obtidas com este modelo usando um conjunto de dados reais. Usando métodos MCMC, eles obtêm uma amostra do tamanho da parte posterior da razão de médias φ que é mostrada abaixo2000 φ
3. Algumas outras questões , como a avaliação da convergência, a escolha dos valores iniciais, o mau comportamento da cadeia, podem ser encontradas nesta discussão por Gelman, Carlin e Neal.
4. Amostragem de Importância
fonte
Darren Wilkinson, em seu blog, fornece um exemplo detalhado de um erro comum na caminhada aleatória Metropolis-Hastings. Eu recomendo a leitura na íntegra, mas aqui está a versão tl; dr.
Se a distribuição de destino for positiva (como distribuições gama etc. ) em uma dimensão, é tentador rejeitar propostas que tenham um valor negativo nessa dimensão imediatamente. O erro é jogar fora as propostas como nunca aconteceram e avaliar a taxa de aceitação de Metropolis-Hastings (MH) apenas das outras. Isso é um erro, porque equivale a usar uma densidade de proposta não simétrica.
O autor sugere aplicar uma das duas correções.
Conte os "negativos" como falha na aceitação (e perca um pouco de eficiência).
Use a proporção correta de MH nesse caso, que é
fonte
Um caso muito claro (relacionado à aproximação de verossimilhança marginal mencionada na primeira resposta) em que a convergência verdadeira é o exemplo do problema da troca de etiquetas em modelos de mistura, juntamente com o uso do estimador de Chib (1995) . Como apontado por Radford Neal (1999), se a cadeia MCMC não convergir corretamente, no sentido de explorar parte do modo de distribuição de destino, a aproximação de Chib a Monte Carlo falha em atingir o valor numérico correto.
fonte