Eu sei que o método Inverso de Transformação nem sempre é uma boa opção para amostragem de distribuições, porque é um método analítico dependente da forma da função de distribuição. Por exemplo, a distribuição Gaussiana inversa e unidimensional é impossível de calcular, no entanto, a amostragem fornece bons resultados. Eu poderia dizer que, para mim, esse método é tudo o que preciso. Mas, os métodos MCMC ( Metropolis-Hastings ou Rejeição ) poderiam ter um desempenho melhor que a Inversa? Os métodos MCMC são melhores que a TI, porque cobrem eventos mais raros ? Ou existem outras vantagens? Alguns exemplos podem ajudar! Obrigado!
sampling
mcmc
metropolis-hastings
rejection-sampling
Teodor Petrut
fonte
fonte
Respostas:
Não é totalmente correto dizer que métodos inversos são impossíveis de calcular. Existem aproximações numéricas perfeitamente boas para o CDF gaussiano inverso . Tanto quanto sei, muitos métodos o usam para gerar variáveis aleatórias gaussianas. É claro que existem muitos outros métodos, possivelmente mais simples, de gerar gaussianos.
No que diz respeito à amostragem por rejeição, este é um saco misto. Se é o pdf gaussiano, na amostragem por rejeição, você precisa encontrar um PDF que domine : , para alguns . Uma interpretação para aqui é o número esperado de rejeições que você precisa fazer antes de aceitar uma amostra, portanto, quanto menor o melhor. Esse problema pode tornar a amostragem de rejeição uma grande dor, porque às vezes é enorme. A regra aqui é que, se você não conseguir encontrar um que torne tratável, precisará procurar outros métodos, por exemplo, o método de transformação inversa.f( X ) g( X ) f( X ) f( x ) ≤ Mg( X ) M> 0 M M M g M
Por exemplo, a distribuição exponencial funciona para a distribuição normal (na verdade a única face normal, após a qual você pode jogar uma moeda para decidir sobre o sinal). Nesse caso, você pode calcular , o que é ótimo porque o exponencial é muito fácil de gerar usando o método inverso do cdf e você só precisa jogar aproximadamente 2 amostras em média . O bom da amostragem de rejeição combinada com o MCMC é que, quando usado de maneira inteligente , você pode simular eventos raros sem realmente precisar esperar a vida útil do universo para que o evento ocorra.M=2 π/ e----√= 1,32
fonte
As comparações entre métodos de simulação são apenas sobre eficiência, pois todos eles produzem uma saída que deveria ser da mesma distribuição de destino. Portanto, você não pode esperar que um método de simulação (como o MCMC) produza mais eventos raros do que outro, pois esses eventos raros devem ocorrer na taxa correta (e rara).
A abordagem de transformação inversa de cdf, ou seja, retornarF-( U) quando você é U(0,1) , conforme distribuído de F . é matematicamente correto. Pode se tornar ineficiente ao computarF−1 é muito exigente. Se o software de sua escolha incluir um código para esse inverso, não há necessidade de procurar mais, a menos que você esteja preocupado com a precisão da inversão (mas, em seguida, precise encontrar outro método com uma precisão numérica mais alta!). Se o cdf inverso não é codificado e requer um investimento pesado em codificação, é mais eficiente buscar métodos genéricos, como os métodos Monte Carlo da cadeia de Markov, que sofrem com a desvantagem de não garantir simulações que vêm exatamente do alvo. Estes são métodos assintóticos, em que a distribuição da simulação só converge para a distribuição alvo quando o número de etapas de Markov aumenta para o infinito (exceto em casos especiais em que a convergência pode ser validada após um número finito de etapas). Mas estes também são genéricos métodos que requerem menos codificação e planejamento, portanto métodos mais eficientes no sentido de que o tempo do computador é bastante barato, quando comparado ao tempo do próprio codificador.
fonte