Existe muita literatura sobre os diagnósticos de convergência Monte Carlo (MCMC) da cadeia de Markov, incluindo o diagnóstico Gelman-Rubin mais popular. No entanto, todos eles avaliam a convergência da cadeia de Markov e, portanto, abordam a questão da queima.
Depois de descobrir o burn-in, como devo decidir quantas amostras do MCMC são suficientes para continuar com meu processo de estimativa? A maioria dos artigos que usam o MCMC menciona que eles administraram a cadeia de Markov por algumas iterações, mas não dizem nada sobre por que / como eles escolheram esse número, n .
Além disso, um tamanho de amostra desejado não pode ser a resposta para todos os amostradores, uma vez que a correlação na cadeia de Markov varia muito de problema para problema. Então, existe uma regra para descobrir o número de amostras necessárias?
fonte
John Kruschke, em Doing Bayesian Data Analysis, recomenda que, para os parâmetros de interesse, as cadeias MCMC sejam executadas até que o tamanho efetivo da amostra seja de pelo menos 10.000. Embora nenhuma simulação seja apresentada, acredito que sua lógica é que ESS> 10.000 assegure estimativas numericamente estáveis. No entanto, vi que Andrew Gelman e outros desenvolvedores do Stan recomendam menos (por exemplo, 2000 - 3000 é bom; infelizmente não há link exato, mas veja discussões no grupo de usuários do Stan Google). Além disso, para modelos complexos, a execução de cadeias longas o suficiente para um ESS> 10.000 pode ser árdua!
fonte
Essa é realmente uma das grandes desvantagens das simulações do MCMC, uma vez que não há estimativa geral e apriori do número de amostras. Acho que uma boa literatura aqui é "Algumas coisas que aprendemos (sobre o MCMC)" de Persi Diaconis, que lida com muitas sutilezas das simulações do MCMC, o que pode indicar que não há uma resposta fácil para essa pergunta.
Em geral, fazer boas estimativas sobre o tempo de funcionamento da cadeia exige um bom entendimento do tempo de mistura da cadeia de Markov, que depende muito das propriedades do gráfico subjacente. Existem muitos métodos "burn-in-free" disponíveis para limitar o tempo de mistura de cima, mas todos esses métodos têm em comum que eles precisam de uma compreensão mais profunda da cadeia de Markov subjacente e as constantes envolvidas geralmente são difíceis de calcular . Veja, por exemplo, "Condutância e mistura rápida de cadeias de Markov", de King, "Path Coupling: uma técnica para provar a mistura rápida em cadeias de Markov", de Bubley et al., Ou "Desigualdades de Nash para cadeias finitas de Markov", de Diaconis et al.
fonte