A amostragem baseada em cadeia de Markov é a "melhor" para a amostragem de Monte Carlo? Existem esquemas alternativos disponíveis?

9

Cadeia de Markov Monte Carlo é um método baseado em cadeias de Markov que nos permite obter amostras (em um cenário de Monte Carlo) de distribuições não padronizadas das quais não podemos extrair amostras diretamente.

Minha pergunta é por que a cadeia de Markov é "avançada" na amostragem de Monte Carlo. Uma pergunta alternativa pode ser: existem outras maneiras, como as cadeias de Markov, que podem ser usadas para a amostragem de Monte Carlo? Eu sei (pelo menos olhando a literatura) que o MCMC tem profundas raízes teóricas (em termos de condições como (a) periodicidade, homogeneidade e equilíbrio detalhado), mas me pergunto se existem modelos / métodos probabilísticos "comparáveis" para o Monte Amostragem de Carlo semelhante às cadeias de Markov.

Por favor, me guie se confundi alguma parte da pergunta (ou se parece completamente confusa).

Ikram Ullah
fonte

Respostas:

11

Não há razão para afirmar que a amostragem MCMC é o "melhor" método de Monte Carlo! Normalmente, é no lado oposto pior do que a amostragem IID, pelo menos em termos de variância dos resultantes estimadores Monte Carlo De fato, enquanto esta média converge para a expectativa quando é a distribuição estacionária e limitadora da cadeia Markov , há pelo menos duas desvantagens no uso dos métodos MCMC:Eπ[h(X)]π(Xt)t

1Tt=1Th(Xt)
Eπ[h(X)]π(Xt)t
  1. A cadeia precisa "atingir a estacionariedade", o que significa que precisa esquecer seu valor inicial . Em outras palavras, deve ser "grande o suficiente" para que seja distribuído a partir de . Às vezes, "grande o suficiente" pode exceder em várias ordens de magnitude o orçamento de computação para o experimento. t X t πX0tXtπ
  2. Os valores estão correlacionados, levando a uma variação assintótica que envolve que geralmente excede e, portanto, requer simulações mais longas do que para uma amostra iid.var π ( X ) + 2 Σ t = 1 cov π ( X 0 , X t ) var π ( X )Xt
    varπ(X)+2t=1covπ(X0,Xt)
    varπ(X)

Dito isto, o MCMC é muito útil para manipular configurações em que a amostragem regular de IDI é impossível ou muito cara e onde a amostragem importante é bastante difícil de calibrar, principalmente devido à dimensão da variável aleatória a ser simulada.

No entanto, métodos seqüenciais de Monte Carlo, como filtros de partículas, podem ser mais apropriados em modelos dinâmicos, onde os dados são emitidos por rajadas que precisam de atenção imediata e podem até desaparecer (ou seja, não podem ser armazenados) após um curto período de tempo.

Em conclusão, o MCMC é uma ferramenta muito útil (e muito usada) para lidar com configurações complexas onde as soluções regulares de Monte Carlo falham.

Xi'an
fonte
8

Existem várias maneiras de gerar valores aleatórios a partir de uma distribuição; o McMC é uma delas, mas várias outras também seriam consideradas métodos de Monte Carlo (sem a parte da cadeia de Markov).

O mais direto para a amostragem univariada é gerar uma variável aleatória uniforme e depois conectá-la à função CDF inversa. Isso funciona muito bem se você tiver o CDF inverso, mas é problemático quando o CDF e / ou o inverso são difíceis de calcular diretamente.

Para problemas multivariados, você pode gerar dados de uma cópula e, em seguida, usar o método CDF inverso nos valores gerados para ter algum nível de correlação entre as variáveis ​​(embora especificar os parâmetros corretos para a cópula para obter o nível de correlação desejado muitas vezes exija um pouco de tentativa e erro).

A amostragem por rejeição é outra abordagem que pode ser usada para gerar dados de uma distribuição (univariada ou multivariada) em que você não precisa conhecer o CDF ou seu inverso (e nem a constante de normalização para a função de densidade), mas isso pode ser altamente ineficiente em alguns casos, levando muito tempo.

Se você estiver interessado em resumos dos dados gerados e não nos pontos aleatórios, a amostragem de importância é outra opção.

A amostragem de Gibbs, que é uma forma de amostragem do McMC, permite que você faça uma amostra de onde você não conhece a forma exata da distribuição multivariada, desde que conheça a distribuição condicional de cada variável, dada a outra.

Também existem outros, o que é melhor depende do que você sabe e não sabe e de outros detalhes do problema específico. O McMC é popular porque funciona bem em muitas situações e generaliza para muitos casos diferentes.

Greg Snow
fonte