Vantagem de múltiplas simulações em Monte Carlo à moda antiga?

8

O espírito dessa pergunta vem do "Monte Carlo comum", também conhecido como "bom e velho Monte Carlo"

Suponha que eu tenha uma variável aleatória , comμ : = E [ X ]X

μ:=E[X]σ2:=Var[X]

Ambos são valores desconhecidos, porque a função de distribuição de probabilidade de é desconhecida (ou os cálculos são intratáveis).X

De qualquer forma, suponha que podemos de alguma forma simular desenha (estes são independentes e identicamente distribuídas) a partir da distribuição de . Vamos definir os parâmetros de amostraX 1 , X 2 , , X n XnX1,X2,,XnX

μ^n:=1ni=1nXiσ^n2:=1ni=1n(Xiμ^n)2

De acordo com o Teorema do Limite Central, quando se tornar muito grande, a média da amostra obedecerá de perto a uma distribuição normalμ nnμ^n

μ^N(μ,σ2n)

Antes de calcularmos os intervalos de confiança, o autor afirma que, como não conhecemos , faremos a estimativa de que , ou mais precisamente, para uma estimativa imparcial , e podemos prosseguir a partir daí usando técnicas padrão.σ2σ2σ^2σ2nn1σ^2

Agora, enquanto o autor menciona a importância de suficientemente grande ( número de empates por simulação), não há menção sobre o número de simulações e seus efeitos sobre a nossa confiança.n

Existe alguma vantagem em executar simulações (executando draws de cada vez) para obter vários meios de amostra e use os meios para melhorar nossas estimativas e confiança em relação ao desconhecido de ?knμ^n,1,μ^n,2,μ^n,kμ,σX

Ou basta desenhar amostras de em uma única simulação, desde que seja suficientemente grande?nXn

jII
fonte

Respostas:

5

Desde que sejam evitados problemas relacionados à geração de números pseudo-aleatórios (ver nota no final), as duas abordagens ( simulações com empates vs. simulação única com suficientemente grande ) são equivalentes em relação à estimativa da média . Em relação à memória, observe que, no caso de simulações, é necessário armazenar os meios de amostra antes de executar o média final, embora isso não ocorra no cenário de simulação única. Nos computadores modernos, executar uma única simulação com suficientemente grande não deve ser mais difícil do que o descrito anteriormente e, de fato, economizar tempo.knnkμ^n,1,,μ^n,kn

A razão matemática além da equivalência é linearidade. Para ser mais preciso, no cenário de simulações , você calcula a média da amostra "final" seguinte forma onde indica o sorteio numerado na simulação . Essa ordenação é arbitrária se nada de estranho acontecer; portanto, você pode re-rotular cada com um novo índice, digamos , obtendo kμ^ X ( h ) i iHX ( h ) i m=1,...,nk μ =1

μ^=1kh=1kμ^n,h=1kh=1k1ni=1nXi(h)=1nkh=1ki=1nXi(h)
Xi(h)ihXi(h)m=1,,nknk
μ^=1nkm=1nkXm
Mas isso é equivalente a executar uma única simulação com draws (obviamente, os draws devem ser iid, como já foi observado).nk

Nota: Problemas potenciais com PRNGs são descritos na página da Wikipedia .

PseudoRandom
fonte
1
Ótima resposta! Eu fiz essa percepção um pouco depois de postar. E como a variação de nossa amostragem é inversamente proporcional a (o número de amostras), nossa confiança também é melhorada (pelo menos teoricamente). n
jii