A aplicação do CLT à soma de variáveis ​​aleatórias é uma boa aproximação?

7

Eu uso para significar uma distribuição com média \ mu e variância \ sigma ^ 2 , \ mathcal {N} adicionado para significar a distribuição normal.(μ,σ2)μσ2N

Vamos supor que com . A declaração formal do teorema do limite central (CLT) diz que Foi discutido aqui que a declaração não é uma afirmação sobre convergência na distribuição, mas antes, uma aproximação. Essa aproximação é frequentemente citada como sendo uma aproximação bastante decente quando .X1,,Xniid(μ,σ2)σ2<

X¯nμσ/ndN(0,1).
X¯nN(μ,σ2/n)
n30

Agora, teoricamente, poderíamos dar um passo adiante e dizer que é um declaração aproximada do CLT.

(1)i=1nXiN(nμ,nσ2)

Dado que (1) não é o CLT real, eu me pergunto o quão bem essa aproximação é executada. Funciona bem em geral? Honestamente, eu ficaria preocupado com isso no caso de uma distribuição particularmente distorcida.

Se isso for muito amplo, eu posso fechar isso.

Clarinetist
fonte
2
Essa é uma pergunta muito bem elaborada. Você pode achar que as respostas já apareceram. Tente esta pesquisa: stats.stackexchange.com/search?q=esseen .
whuber
2
Você pode consultar o teorema de Berry-Esseen para obter informações sobre a taxa de convergência. O termo boa aproximação é subjetivo. Para ser preciso, defina qual deve ser a distância máxima entre a distribuição aproximada e o normal padrão para que a aproximação seja "boa".
Michael R. Chernick
11
Eu não acho que seja uma notação precisa o suficiente (mesmo com o texto adicional explicando isso). Uma notação melhor seria " é ", com o entendimento de que significa converge para na distribuição. X¯nN(μ,σ2/n)X¯nAN(μ,σ2/n)n(X¯nμ)/σN(0,1)
precisa saber é o seguinte
11
@ Zhanxiong: a notação com a qual estou mais familiarizado é , com significa "distribuído aproximadamente". X¯n˙N(μ,σ2/n)˙
Cliff AB
11
Empiricamente, a qualidade da aproximação depende da distribuição subjacente de . Intuitivamente, a aproximação funciona melhor para rvs simétricos e contínuos. Por exemplo, você pode precisar de muito menor para obter uma aproximação normal decente para do que para . XinXBin(1,0.5)XBin(1,0.01)
precisa saber é o seguinte

Respostas:

5

Ao contrário, se o escore Z fosse realmente uma distribuição normal padrão, suas aproximações subsequentes seriam exatas. O grau de erro deve escalar aproximadamente com alguma medida da distância entre a distribuição do escore Z e o Gaussiano padrão.

Podemos usar a distância KS como nossa métrica no espaço dos CDFs. Digamos que coletaremos amostras e nosso (desconhecido) CDF de amostra verdadeira do escore Z dessas amostras terá uma distância KS de : .NNϵNmaxz|FZn(z)FΦ(z)|=ϵN

Agora, passando de para onde envolve apenas uma mudança de escala e localização (ou seja, uma transformação linear do argumento de ). O mesmo se aplica para obter em uma soma de variáveis ​​aleatórias normais com a mesma média e variação que a sua população real. De fato, você estará fazendo exatamente a mesma transformação para ambas as variáveis; portanto, simplesmente e da mesma forma para - porque estamos sujeitando o argumento de cada distribuição à mesma transformação, preservaremos distâncias verticais.FZn(z)FSn(s)Sn=1NXiLzFZn(z)FΦ(z)FZn(z)FZn(L1z)FΦ

Portanto, a distância KS para convergirá para zero na mesma taxa que para . No entanto, não tem uma distribuição limitadora (é basicamente , o que não é uma distribuição) enquanto converge para uma função de distribuição real.FSnFZnFSnF(x)=0.5FZn


fonte