Eu uso para significar uma distribuição com média \ mu e variância \ sigma ^ 2 , \ mathcal {N} adicionado para significar a distribuição normal.
Vamos supor que com . A declaração formal do teorema do limite central (CLT) diz que Foi discutido aqui que a declaração não é uma afirmação sobre convergência na distribuição, mas antes, uma aproximação. Essa aproximação é frequentemente citada como sendo uma aproximação bastante decente quando .
Agora, teoricamente, poderíamos dar um passo adiante e dizer que é um declaração aproximada do CLT.
Dado que não é o CLT real, eu me pergunto o quão bem essa aproximação é executada. Funciona bem em geral? Honestamente, eu ficaria preocupado com isso no caso de uma distribuição particularmente distorcida.
Se isso for muito amplo, eu posso fechar isso.
fonte
Respostas:
Ao contrário, se o escore Z fosse realmente uma distribuição normal padrão, suas aproximações subsequentes seriam exatas. O grau de erro deve escalar aproximadamente com alguma medida da distância entre a distribuição do escore Z e o Gaussiano padrão.
Podemos usar a distância KS como nossa métrica no espaço dos CDFs. Digamos que coletaremos amostras e nosso (desconhecido) CDF de amostra verdadeira do escore Z dessas amostras terá uma distância KS de : .N N ϵN maxz|FZn(z)−FΦ(z)|=ϵN
Agora, passando de para onde envolve apenas uma mudança de escala e localização (ou seja, uma transformação linear do argumento de ). O mesmo se aplica para obter em uma soma de variáveis aleatórias normais com a mesma média e variação que a sua população real. De fato, você estará fazendo exatamente a mesma transformação para ambas as variáveis; portanto, simplesmente e da mesma forma para - porque estamos sujeitando o argumento de cada distribuição à mesma transformação, preservaremos distâncias verticais.FZn(z) FSn(s) Sn=∑N1Xi Lz FZn(z) FΦ(z) FZn(z)↦FZn(L−1z) FΦ
Portanto, a distância KS para convergirá para zero na mesma taxa que para . No entanto, não tem uma distribuição limitadora (é basicamente , o que não é uma distribuição) enquanto converge para uma função de distribuição real.FSn FZn FSn F(x)=0.5 FZn
fonte