O MCMC adaptável pode ser confiável?

20

Estou lendo sobre o MCMC adaptável (veja, por exemplo, o Capítulo 4 do Manual da Cadeia de Markov Monte Carlo , ed. Brooks et al., 2011; e também Andrieu & Thoms, 2008 ).

O principal resultado de Roberts e Rosenthal (2007) é que, se o esquema de adaptação satisfizer a condição de desaparecimento da adaptação (mais alguma outra tecnicidade), o MCMC adaptativo é ergódico em qualquer esquema. Por exemplo, a fuga de adaptação pode ser facilmente obtida adaptando o operador de transição na iteração com probabilidade , com .np(n)limnp(n)=0

Esse resultado é (a posteriori) intuitivo, assintoticamente. Como a quantidade de adaptação tende a zero, eventualmente não atrapalha a ergodicidade. Minha preocupação é o que acontece com o tempo finito .

  • Como sabemos que a adaptação não está atrapalhando a ergodicidade em um determinado tempo finito e que um amostrador está amostrando a partir da distribuição correta? Se faz algum sentido, quanto esforço deve ser feito para garantir que a adaptação precoce não influencie as cadeias?

  • Os profissionais de campo confiam no MCMC adaptável? A razão pela qual estou perguntando é porque vi muitos métodos recentes que tentam incorporar a adaptação de outras maneiras mais complexas que respeitam a ergodicidade, como métodos de regeneração ou de conjunto (ou seja, é legítimo escolher uma transição operador que depende do estado de outras cadeias paralelas). Como alternativa, a adaptação é realizada apenas durante a queima, como em Stan , mas não em tempo de execução. Todos esses esforços me sugerem que o MCMC adaptável, de acordo com Roberts e Rosenthal (que seria incrivelmente simples de implementar), não é considerado confiável; mas talvez haja outras razões.

  • E implementações específicas, como Metropolis-Hastings adaptável ( Haario et al. 2001 )?


Referências

lacerbi
fonte
1
+1, mas existem garantias de tempo finito mesmo para o MCMC não adaptável?
Juho Kokkala
2
@JuhoKokkala: provavelmente não, mas parece que, com o MCMC adaptável, estamos adicionando outra camada de possíveis modos de falha, que são menos compreendidos e mais difíceis de verificar do que os problemas padrão de convergência (que já são bastante difíceis de diagnosticar). Pelo menos, essa é minha compreensão de por que os praticantes (eu, pelo menos) ficariam cautelosos com isso.
lacerbi
1
Eu acho que a adaptação durante o burnin é a melhor maneira de lidar com a adaptação. Obviamente, se você tem algumas áreas posteriores que exigem ajustes diferentes das outras, haverá problemas, mas se for esse o caso, se você executar o MCMC totalmente adaptável, não poderá se adaptar muito por causa da condição de fuga. .
sega_sai

Respostas:

2

Como sabemos que a adaptação não está atrapalhando a ergodicidade em um determinado tempo finito e que um amostrador está amostrando a partir da distribuição correta? Se faz algum sentido, quanto esforço deve ser feito para garantir que a adaptação precoce não influencie as cadeias?

A ergodicidade e o viés são sobre propriedades assintóticas da cadeia de Markov, eles não dizem nada sobre o comportamento e a distribuição da cadeia de Markov at a given finite time. A adaptabilidade não tem nada a ver com esse problema; qualquer algoritmo MCMC pode produzir simulações distantes do alvo at a given finite time.

Xi'an
fonte
1
(+1) Obrigado pelo esclarecimento. Sim, entendo que os algoritmos do MCMC não têm garantias at a given finite time. No entanto, na prática, nós os usamos como se eles fornecessem uma aproximação boa / razoável da distribuição de destino em um determinado tempo finito, mesmo que na maioria dos casos não haja garantias teóricas (AFAIK apenas alguns casos são matematicamente entendidos). Talvez eu devesse dizer "mexer com o tempo da mistura "? É mais perto do que eu quis dizer. Se você tiver sugestões sobre como corrigir o idioma, entre em contato.
lacerbi