Erro na aproximação normal de uma distribuição de soma uniforme

20

Um método ingênuo para aproximar uma distribuição normal é adicionar talvez variáveis ​​aleatórias de IID uniformemente distribuídas em , depois mais recentes e redimensionar, contando com o Teorema do Limite Central. ( Observação : existem métodos mais precisos, como a transformação Box-Muller .) A soma das variáveis ​​aleatórias IID é conhecida como distribuição uniforme da soma ou distribuição Irwin-Hall .100[0,1]U(0,1)

Qual o tamanho do erro na aproximação de uma distribuição de soma uniforme por uma distribuição normal?

Sempre que esse tipo de pergunta surge para aproximar a soma das variáveis ​​aleatórias do IID, as pessoas (inclusive eu) trazem o Teorema de Berry – Esseen , que é uma versão eficaz do Teorema do Limite Central, uma vez que existe o terceiro momento:

|Fn(x)Φ(x)|Cρσ3n

onde é a função de distribuição cumulativa para a soma redimensionada de variáveis ​​aleatórias do IID, é o terceiro momento central absoluto, é o desvio padrão e é uma constante absoluta que pode ser considerada ou até .FnnρE|(XEX)3|σC11/2

Isso é insatisfatório. Parece-me que a estimativa de Berry-Esseen é a mais próxima possível das distribuições binomiais discretas, com o maior erro em para uma distribuição binomial simétrica. O maior erro ocorre no maior salto. No entanto, a distribuição de soma uniforme não tem saltos.0

Testes numéricos sugerem que o erro diminui mais rapidamente que .c/n

Usando , a estimativa de Berry – Esseen é| F n ( x ) - Φ ( x ) | 1C=1/2

|Fn(x)Φ(x)|121321123n0.650n

que para é de cerca de , e , respectivamente. As diferenças máximas reais para parecem ser cerca de , e , respectivamente, que são muito menores e parecem cair como vez de .0,205 0,145 0,103 n = 10 , 20 , 40 0,00281 0,00139 0,000692 c / nn=10,20,400.2050.1450.103n=10,20,400.002810.001390.000692c/nc/n

Douglas Zare
fonte
7
Se você expandir a distribuição da soma em uma expansão Edgeworth , descobrirá que uniformemente em como (como a distribuição uniforme é simétrica), então soa correto. Por causa do prazo, que não dar-lhe um limite embora ...x n Fn(x)=Φ(x)+n-1g(x)+o(n-1)xno ( n - 1 )c/no(n-1)
MånsT
1
Obrigado, parece que também explica o padrão para muitas outras distribuições. c/n
Douglas Zare

Respostas:

17

Seja iid variáveis ​​aleatórias e considere a soma normalizada e a norm onde é a distribuição de .U ( - b , b ) S n = você1,você2,...você(-b,b)

Sn=3Eu=1nvocêEubn,
δ n = sup x R | F n ( x ) - Φ ( x ) |supF n S n
δn=supxR|Fn(x)-Φ(x)|,
FnSn

Lema 1 ( Uspensky ): O seguinte limite em é válido. δn

δn<17,5πn+1π(2π)n+12π3nexp(-π2n/24).

Prova . Ver JV Uspensky (1937), Introdução à probabilidade matemática , Nova York: McGraw-Hill, p. 305

Isso foi posteriormente aprimorado por R. Sherman para o seguinte.

Lema 2 ( Sherman ): A seguinte melhoria no limite de Uspensky é válida.

δn<17,5πn-(π180+17,5πn)e-π2n/24+1(n+1)π(2π)n+12π3ne-π2n/24.

Prova : Ver R. Sherman, Erro da aproximação normal à soma de N variáveis ​​aleatórias , Biometrika , vol. 58, n. 2, 396-398.

A prova é uma aplicação bastante direta da desigualdade do triângulo e dos limites clássicos na cauda da distribuição normal e em aplicado às funções características de cada uma das duas distribuições.(pecadox)/x

cardeal
fonte
2
+1 no lema 2? N=n
@ Procrastinator: Boa captura.
cardeal
1
Obrigado! Essas referências são muito úteis. As estimativas parecem estar dentro de um fator de do valor real. 2
Douglas Zare