Intrigado com uma pergunta em math.stackexchange e investigando-a empiricamente, estou pensando na seguinte declaração sobre a raiz quadrada de somas de variáveis aleatórias iid.
Suponha que são variáveis aleatórias iid com média finita diferente de zero e variância e . O teorema do limite central diz medida que aumenta. μ σ 2 Y = n ∑ i = 1 X i Y - n μn
Se , também posso dizer algo como medida que aumenta?Z - √n
Por exemplo, suponha que seja Bernoulli com média e variância , então é binomial e eu posso simular isso em R, digamos com : p p ( 1 - p ) Y p = 1
set.seed(1)
cases <- 100000
n <- 1000
p <- 1/3
Y <- rbinom(cases, size=n, prob=p)
Z <- sqrt(abs(Y))
que fornece aproximadamente a média esperada e variância para
> c(mean(Z), sqrt(n*p - (1-p)/4))
[1] 18.25229 18.25285
> c(var(Z), (1-p)/4)
[1] 0.1680012 0.1666667
e um gráfico QQ que parece próximo de Gaussian
qqnorm(Z)
Respostas:
A convergência para um gaussiano é de fato um fenômeno geral.
Suponha que sejam variáveis aleatórias de com média e variação e defina as somas . Corrija um número . O usual Teorema do Limite Central nos diz que como , onde é o cdf normal padrão. No entanto, a continuidade do cdf limitador implica que também temosX1,X2,X3,... μ>0 σ2 Yn=∑ni=1Xi α P(Yn−nμσn√≤α)→Φ(α) n→∞ Φ
Tomando raízes quadradas e observando que implica que , obtemos Em outras palavras, . Este resultado demonstra convergência para um gaussiano no limite como .μ>0 P(Yn<0)→0
Isso significa que é uma boa aproximação de para grande ? Bem, podemos fazer melhor que isso. Como @Henry observa, assumindo que tudo é positivo, podemos usar , juntamente com e a aproximação , para obter a aproximação aprimorada conforme indicado na pergunta acima. Observe também que ainda temos porquenμ−−−√ E[|Yn|−−−√] n E[Yn−−√]=E[Yn]−Var(Yn−−√)−−−−−−−−−−−−−−−√ E[Yn]=nμ Var(Yn−−√)≈σ24μ E[|Yn|−−−√]≈nμ−σ24μ−−−−−−−√
fonte