Referindo-se a este tópico: Como você explicaria o Markov Chain Monte Carlo (MCMC) a um leigo? .
Eu posso ver que é uma combinação de cadeias de Markov e Monte Carlo: uma cadeia de Markov é criada com a posterior como distribuição limitadora invariante e, em seguida, os sorteios de Monte Carlo (dependentes) são feitos a partir da distribuição limitadora (= nossa posterior).
Digamos (eu sei que estou simplificando aqui) que, após as etapas , estamos na distribuição limitadora (*).
Como a cadeia de Markov é uma sequência de variáveis aleatórias, recebo uma sequência , em que é uma variável aleatória e é o limitador ' 'variável aleatória' 'da qual desejamos amostrar.
O MCMC inicia com um valor inicial, ou seja, é uma variável aleatória com toda a massa nesse valor . Se eu usar letras maiúsculas para variáveis aleatórias e letras minúsculas para a realização de uma variável aleatória, o MCMC uma sequência . Portanto, o comprimento da cadeia MCMC é L + n.
[[* Nota: as letras maiúsculas são variáveis aleatórias (ou seja, um monte de resultados) e o pequeno são resultados, ou seja, um valor específico. *]]
Obviamente, apenas o pertence ao meu '' posterior '' e, para aproximar o '' poço '' posterior, o valor de deve ser '' grande o suficiente ''.
Se eu resumir isso, tenho uma cadeia MCMC de comprimento , apenas são relevantes para minha aproximação posterior, e deve ser grande o suficiente. N = L + n π 1 , π 2 , … , π n n
Se eu incluir alguns dos (ou seja, realizações antes que a distribuição invariante seja alcançada) no cálculo da aproximação do posterior, será "barulhento".
Eu sei o comprimento da cadeia MCMC , mas sem o conhecimento do , ou seja, a etapa em que tenho certeza de colher amostras da distribuição limitadora, não posso ter certeza de que não incluí ruído, nem posso tenha certeza de , o tamanho da minha amostra da distribuição limitadora, em particular, não posso ter certeza se ela é '' grande o suficiente ''. L n = N - L
Então, tanto quanto eu entendi, esse valor de é de importância crítica para a qualidade da aproximação do posterior (exclusão de ruído e uma grande amostra dele) .
Existem maneiras de encontrar uma estimativa razoável para quando aplico o MCMC?
(*) Eu acho que, em geral, dependerá do valor inicial .x 1