Uso dos métodos de amostragem Metropolis & Rejection & Inverse Transform

7

Eu sei que o método Inverso de Transformação nem sempre é uma boa opção para amostragem de distribuições, porque é um método analítico dependente da forma da função de distribuição. Por exemplo, a distribuição Gaussiana inversa e unidimensional é impossível de calcular, no entanto, a amostragem fornece bons resultados. Eu poderia dizer que, para mim, esse método é tudo o que preciso. Mas, os métodos MCMC ( Metropolis-Hastings ou Rejeição ) poderiam ter um desempenho melhor que a Inversa? Os métodos MCMC são melhores que a TI, porque cobrem eventos mais raros ? Ou existem outras vantagens? Alguns exemplos podem ajudar! Obrigado!

Teodor Petrut
fonte
11
Provavelmente isso deveria ter sido fechado até que fique mais claro, mas com algumas boas respostas, então deixarei as coisas por enquanto. Existem vários problemas, incluindo ... 1. Existem muitos métodos para amostragem de distribuições normais - incluindo muitas variantes na amostragem por rejeição. Portanto, a amostragem por rejeição pode ser melhor e pior que outra abordagem 2 Melhor em que sentido? 3. Algumas instalações não estão corretas. O cdf normal inverso pode ser calculado (até qualquer nível de precisão exigido), simplesmente não existe na forma fechada. Podemos computá-lo no mesmo sentido em que podemos calcular um arcsin.
Glen_b -Reinstar Monica

Respostas:

7

Não é totalmente correto dizer que métodos inversos são impossíveis de calcular. Existem aproximações numéricas perfeitamente boas para o CDF gaussiano inverso . Tanto quanto sei, muitos métodos o usam para gerar variáveis ​​aleatórias gaussianas. É claro que existem muitos outros métodos, possivelmente mais simples, de gerar gaussianos.

No que diz respeito à amostragem por rejeição, este é um saco misto. Se é o pdf gaussiano, na amostragem por rejeição, você precisa encontrar um PDF que domine : , para alguns . Uma interpretação para aqui é o número esperado de rejeições que você precisa fazer antes de aceitar uma amostra, portanto, quanto menor o melhor. Esse problema pode tornar a amostragem de rejeição uma grande dor, porque às vezes é enorme. A regra aqui é que, se você não conseguir encontrar um que torne tratável, precisará procurar outros métodos, por exemplo, o método de transformação inversa.f(x)g(x) f(x)f(x)Mg(x)M>0MMMgM

Por exemplo, a distribuição exponencial funciona para a distribuição normal (na verdade a única face normal, após a qual você pode jogar uma moeda para decidir sobre o sinal). Nesse caso, você pode calcular , o que é ótimo porque o exponencial é muito fácil de gerar usando o método inverso do cdf e você só precisa jogar aproximadamente 2 amostras em média . O bom da amostragem de rejeição combinada com o MCMC é que, quando usado de maneira inteligente , você pode simular eventos raros sem realmente precisar esperar a vida útil do universo para que o evento ocorra.M=2π/e=1.32

Alex R.
fonte
11
Você pode precisar o que você quer dizer com trabalhos exponenciais para o normal? A rigor, isso está incorreto, pois o exponencial tem um suporte menor,R+.
Xian
@ Xi'an: letras miúdas: gere uma distribuição meia Gaussiana usando exponencial e depois jogue uma moeda para decidir o sinal. Eu suponho que você também pode usar uma distribuição Lorenz diretamente
Alex R.
3

As comparações entre métodos de simulação são apenas sobre eficiência, pois todos eles produzem uma saída que deveria ser da mesma distribuição de destino. Portanto, você não pode esperar que um método de simulação (como o MCMC) produza mais eventos raros do que outro, pois esses eventos raros devem ocorrer na taxa correta (e rara).

A abordagem de transformação inversa de cdf, ou seja, retornar F(U) quando U é U(0,1), conforme distribuído de F. é matematicamente correto. Pode se tornar ineficiente ao computarF1é muito exigente. Se o software de sua escolha incluir um código para esse inverso, não há necessidade de procurar mais, a menos que você esteja preocupado com a precisão da inversão (mas, em seguida, precise encontrar outro método com uma precisão numérica mais alta!). Se o cdf inverso não é codificado e requer um investimento pesado em codificação, é mais eficiente buscar métodos genéricos, como os métodos Monte Carlo da cadeia de Markov, que sofrem com a desvantagem de não garantir simulações que vêm exatamente do alvo. Estes são métodos assintóticos, em que a distribuição da simulação só converge para a distribuição alvo quando o número de etapas de Markov aumenta para o infinito (exceto em casos especiais em que a convergência pode ser validada após um número finito de etapas). Mas estes também são genéricos métodos que requerem menos codificação e planejamento, portanto métodos mais eficientes no sentido de que o tempo do computador é bastante barato, quando comparado ao tempo do próprio codificador.

Xi'an
fonte