Posso alterar a distribuição da proposta no MH MCMC de maneira aleatória sem afetar o Markovianity?

14

Passeio aleatório Metropolis-Hasitings com proposta simétrica

tem a propriedade de que a probabilidade de aceitaçãoq(x|y)=g(|y-x|)

P(umaccept y)=min{1,f(y)/f(x)}

não depende da proposta .g()

Isso significa que eu posso mudar o em função do desempenho anterior da cadeia, sem afetar a marca da cadeia?g()

De particular interesse para mim é o ajuste da escala da proposta Normal em função da taxa de aceitação.

Também apreciaria muito se alguém pudesse apontar para os algoritmos de adaptação usados ​​na prática para esse tipo de problema.

Muito Obrigado.

[edit: Começando com as referências dadas por robertsy e wok, encontrei as seguintes referências nos algoritmos adaptativos MH:

Andrieu, Christophe e Éric Moulines. 2006.
Sobre as propriedades de ergodicidade de alguns algoritmos adaptativos do MCMC. Os Anais da Probabilidade Aplicada 16, no. 3: 1462-1505. http://www.jstor.org/stable/25442804 .

Andrieu, Christophe e Johannes Thoms.
2008. Um tutorial sobre MCMC adaptável. Estatística e Computação 18, no. 4 (12): 343-373. doi: 10.1007 / s11222-008-9110-y. http://www.springerlink.com/content/979087678366r78v/ .

Atchadé, Y., G. Fort, E. Moulines e P. Priouret. 2009.
Cadeia de Markov Adaptativa Monte Carlo: Teoria e Métodos. Pré-impressão.

Atchadé, Yves. 2010.
Teoremas de limite para alguns algoritmos adaptativos do MCMC com kernels subgeométricos. Bernoulli 16, n. 1 (fevereiro): 116-154. doi: 10.3150 / 09-BEJ199. http://projecteuclid.org/DPubS?verb=Display&version=1.0&service=UI&handle=euclid.bj/1265984706&page=record .

Cappé, O., S.J Godsill e E. Moulines. 2007.
Uma visão geral dos métodos existentes e avanços recentes no Monte Carlo seqüencial. Anais do IEEE 95, no. 5: 899-924.

Giordani, Paolo. 2010.
Metropolis Independent Adaptive – Hastings por estimativa rápida de misturas de normais. Revista de Estatística Computacional e Gráfica 19, no. 2 (6): 243-259. doi: 10.1198 / jcgs.2009.07174. http://pubs.amstat.org/doi/abs/10.1198/jcgs.2009.07174 .

Latuszynski, Krzysztof, Gareth O Roberts e Jeffrey S. Rosenthal. 2011.
Amostradores adaptativos de Gibbs e métodos relacionados do MCMC. 1101.5838 (30 de janeiro). http://arxiv.org/abs/1101.5838 .

Pasarica, C. e A. Gelman. 2009.
Escalabilidade adaptativa do algoritmo Metropolis usando a distância ao quadrado esperada. Statistica Sinica.

Roberts, Gareth O. 2009.
Exemplos de MCMC adaptativo. Revista de Estatística Computacional e Gráfica 18, no. 2 (6): 349-367. doi: 10.1198 / jcgs.2009.06134. http://pubs.amstat.org/doi/abs/10.1198/jcgs.2009.06134 .

]

VitoshKa
fonte
Por que você não tem +100 bônus do seu registro no SO?
@mbq, provavelmente porque eu criei essa conta há muito tempo, quando eu tinha 0 no sistema operacional também ... pena, 100 na CW parece um grande negócio, já que você deve ser um sujeito de verdade para responder as coisas aqui :)
VitoshKa
Você pode obter o bônus limpando todas as associações e associando as contas novamente.
Wok

Respostas:

7

Eu acho que este artigo de Heikki Haario et al. lhe dará a resposta que você precisa. A markovianidade da cadeia é afetada pela adaptação da densidade da proposta, pois um novo valor proposto depende não apenas do valor anterior, mas de toda a cadeia. Mas parece que a sequência ainda tem boas propriedades se for tomado muito cuidado.

robertsy
fonte
obrigado robertsy, pela boa referência. de fato, o processo não é markov. Mesmo que a probabilidade de aceitação seja independente do passado, o núcleo de transição do processo é uma função da densidade da proposta e, portanto, depende de toda a cadeia.
Vitoshka
3

Você pode melhorar a taxa de aceitação usando a rejeição atrasada, conforme descrito em Tierney, Mira (1999) . Ele se baseia em uma segunda função de proposta e uma segunda probabilidade de aceitação , o que garante que a cadeia de Markov ainda seja reversível com a mesma distribuição invariável: você precisa ser cauteloso, pois " é fácil construir métodos adaptativos que parecem funcionar, mas de fato amostra da distribuição errada ".

Wok
fonte
3

As abordagens sugeridas pelos usuários wok e robertsy cobrem os exemplos mais citados do que você está procurando e que eu conheço. Apenas para expandir essas respostas, Haario e Mira escreveram um documento em 2006 que combina as duas abordagens, uma abordagem que eles chamam de DRAM (Metropolis adaptativa de rejeição retardada) .

Andrieu tem um bom tratamento de várias abordagens adaptativas do MCMC (pdf), que abordam o Haario 2001, mas também discute várias alternativas propostas nos últimos anos.

redmoskito
fonte
1

Isto é um pouco de um plug descarado de uma publicação do meu, mas o que fazemos exatamente isso no presente trabalho ( arXiv ). Entre outras coisas, propomos adaptar a variação da distribuição exponencial para melhorar a aceitação (etapa S3.2 no algoritmo do artigo).

No nosso caso, assintoticamente, a adaptação não altera a distribuição da proposta (que no artigo é quando f1) Assim, assintoticamente, o processo ainda é markoviano no mesmo espírito que o algoritmo Wang-Landau . Verificamos numericamente que o processo é ergódico e as amostras da cadeia da distribuição alvo que escolhemos (por exemplo, painel inferior esquerdo da Fig. 4).

Não usamos informações sobre a taxa de aceitação, mas obtemos uma aceitação independente da quantidade em que estamos interessados ​​(equivalente à energia de um sistema de rotação, no canto inferior direito da Fig. 4).

Jorge Leitao
fonte