Passeio aleatório Metropolis-Hasitings com proposta simétrica
tem a propriedade de que a probabilidade de aceitação
não depende da proposta .
Isso significa que eu posso mudar o em função do desempenho anterior da cadeia, sem afetar a marca da cadeia?
De particular interesse para mim é o ajuste da escala da proposta Normal em função da taxa de aceitação.
Também apreciaria muito se alguém pudesse apontar para os algoritmos de adaptação usados na prática para esse tipo de problema.
Muito Obrigado.
[edit: Começando com as referências dadas por robertsy e wok, encontrei as seguintes referências nos algoritmos adaptativos MH:
Andrieu, Christophe e Éric Moulines. 2006.
Sobre as propriedades de ergodicidade de alguns algoritmos adaptativos do MCMC. Os Anais da Probabilidade Aplicada 16, no. 3: 1462-1505. http://www.jstor.org/stable/25442804 .
Andrieu, Christophe e Johannes Thoms.
2008. Um tutorial sobre MCMC adaptável. Estatística e Computação 18, no. 4 (12): 343-373. doi: 10.1007 / s11222-008-9110-y. http://www.springerlink.com/content/979087678366r78v/ .
Atchadé, Y., G. Fort, E. Moulines e P. Priouret. 2009.
Cadeia de Markov Adaptativa Monte Carlo: Teoria e Métodos. Pré-impressão.
Atchadé, Yves. 2010.
Teoremas de limite para alguns algoritmos adaptativos do MCMC com kernels subgeométricos. Bernoulli 16, n. 1 (fevereiro): 116-154. doi: 10.3150 / 09-BEJ199. http://projecteuclid.org/DPubS?verb=Display&version=1.0&service=UI&handle=euclid.bj/1265984706&page=record .
Cappé, O., S.J Godsill e E. Moulines. 2007.
Uma visão geral dos métodos existentes e avanços recentes no Monte Carlo seqüencial. Anais do IEEE 95, no. 5: 899-924.
Giordani, Paolo. 2010.
Metropolis Independent Adaptive – Hastings por estimativa rápida de misturas de normais. Revista de Estatística Computacional e Gráfica 19, no. 2 (6): 243-259. doi: 10.1198 / jcgs.2009.07174. http://pubs.amstat.org/doi/abs/10.1198/jcgs.2009.07174 .
Latuszynski, Krzysztof, Gareth O Roberts e Jeffrey S. Rosenthal. 2011.
Amostradores adaptativos de Gibbs e métodos relacionados do MCMC. 1101.5838 (30 de janeiro). http://arxiv.org/abs/1101.5838 .
Pasarica, C. e A. Gelman. 2009.
Escalabilidade adaptativa do algoritmo Metropolis usando a distância ao quadrado esperada. Statistica Sinica.
Roberts, Gareth O. 2009.
Exemplos de MCMC adaptativo. Revista de Estatística Computacional e Gráfica 18, no. 2 (6): 349-367. doi: 10.1198 / jcgs.2009.06134. http://pubs.amstat.org/doi/abs/10.1198/jcgs.2009.06134 .
]
fonte
Respostas:
Eu acho que este artigo de Heikki Haario et al. lhe dará a resposta que você precisa. A markovianidade da cadeia é afetada pela adaptação da densidade da proposta, pois um novo valor proposto depende não apenas do valor anterior, mas de toda a cadeia. Mas parece que a sequência ainda tem boas propriedades se for tomado muito cuidado.
fonte
Você pode melhorar a taxa de aceitação usando a rejeição atrasada, conforme descrito em Tierney, Mira (1999) . Ele se baseia em uma segunda função de proposta e uma segunda probabilidade de aceitação , o que garante que a cadeia de Markov ainda seja reversível com a mesma distribuição invariável: você precisa ser cauteloso, pois " é fácil construir métodos adaptativos que parecem funcionar, mas de fato amostra da distribuição errada ".
fonte
As abordagens sugeridas pelos usuários wok e robertsy cobrem os exemplos mais citados do que você está procurando e que eu conheço. Apenas para expandir essas respostas, Haario e Mira escreveram um documento em 2006 que combina as duas abordagens, uma abordagem que eles chamam de DRAM (Metropolis adaptativa de rejeição retardada) .
Andrieu tem um bom tratamento de várias abordagens adaptativas do MCMC (pdf), que abordam o Haario 2001, mas também discute várias alternativas propostas nos últimos anos.
fonte
Isto é um pouco de um plug descarado de uma publicação do meu, mas o que fazemos exatamente isso no presente trabalho ( arXiv ). Entre outras coisas, propomos adaptar a variação da distribuição exponencial para melhorar a aceitação (etapa S3.2 no algoritmo do artigo).
No nosso caso, assintoticamente, a adaptação não altera a distribuição da proposta (que no artigo é quandof→ 1 ) Assim, assintoticamente, o processo ainda é markoviano no mesmo espírito que o algoritmo Wang-Landau . Verificamos numericamente que o processo é ergódico e as amostras da cadeia da distribuição alvo que escolhemos (por exemplo, painel inferior esquerdo da Fig. 4).
Não usamos informações sobre a taxa de aceitação, mas obtemos uma aceitação independente da quantidade em que estamos interessados (equivalente à energia de um sistema de rotação, no canto inferior direito da Fig. 4).
fonte