Teorema do Limite Central para raízes quadradas de somas de variáveis ​​aleatórias iid

11

Intrigado com uma pergunta em math.stackexchange e investigando-a empiricamente, estou pensando na seguinte declaração sobre a raiz quadrada de somas de variáveis ​​aleatórias iid.

Suponha que são variáveis ​​aleatórias iid com média finita diferente de zero e variância e . O teorema do limite central diz medida que aumenta. μ σ 2 Y = n i = 1 X i Y - n μX1,X2,,Xnμσ2Y=i=1nXinYnμnσ2 d N(0,1)n

Se , também posso dizer algo como medida que aumenta?Z - Z=|Y|nZn|μ|σ24|μ|σ24|μ| d N(0,1)n

Por exemplo, suponha que seja Bernoulli com média e variância , então é binomial e eu posso simular isso em R, digamos com : p p ( 1 - p ) Y p = 1Xipp(1p)Yp=13

set.seed(1)
cases <- 100000
n <- 1000
p <- 1/3
Y <- rbinom(cases, size=n, prob=p)
Z <- sqrt(abs(Y))

que fornece aproximadamente a média esperada e variância paraZ

> c(mean(Z), sqrt(n*p - (1-p)/4))
[1] 18.25229 18.25285
> c(var(Z), (1-p)/4)
[1] 0.1680012 0.1666667

e um gráfico QQ que parece próximo de Gaussian

qqnorm(Z)

insira a descrição da imagem aqui

Henry
fonte
11
@ MichaelM: Obrigado por esses comentários. Eu comecei com o não negativo, mas achei que o comportamento assintótico intuitivo que você descreve permitia uma generalização para mais distribuições. Minhas surpresas foram: (a) a variação da raiz quadrada da soma aparentemente tendendo a uma constante, não dependendo de (b) o aparecimento de uma distribuição que parece muito próxima de Gaussiana. Um contra-exemplo seria bem-vindo, mas quando tentei outros casos que inicialmente pareciam não-gaussianos, o aumento de parecia trazer a distribuição de volta a um resultado do tipo CLT. Xinn
Henry
Um corolário disso é a raiz quadrada média (ou média quadrática) de variáveis ​​aleatórias iid adequadamente dimensionadas (multiplicadas por como com uma média aritmética) também converge para uma distribuição gaussiana, desde que o momento do distribuição subjacente é finita. n4
Henry As
3
Apenas um breve comentário: a alegação é um caso especial do método Delta, veja o Teorema 5.5.24 no livro "Inferência Estatística", de Casella & Berger.
Michael M
@ Michael: Talvez você veja algo que não estou no momento, mas não acho que esse problema específico se encaixe nas suposições do método Delta clássico (por exemplo, conforme indicado no teorema que você faz referência). Observe que não converge na distribuição (não trivialmente em ) e, portanto, "aplicar o método Delta com " não atende aos requisitos necessários. No entanto, como demonstra a resposta de S. Catterall, fornece uma heurística útil que leva à resposta correta. YRg(y)=|y|
cardinal
(Acredito que você pode adaptar a prova do método Delta a casos semelhantes ao acima, a fim de tornar totalmente rigorosa a heurística acima mencionada.) #
2222

Respostas:

14

A convergência para um gaussiano é de fato um fenômeno geral.

Suponha que sejam variáveis ​​aleatórias de com média e variação e defina as somas . Corrija um número . O usual Teorema do Limite Central nos diz que como , onde é o cdf normal padrão. No entanto, a continuidade do cdf limitador implica que também temosX1,X2,X3,...μ>0σ2Yn=i=1nXiαP(Ynnμσnα)Φ(α)nΦ

P(Ynnμσnα+α2σ24μσn)Φ(α)
porque o termo adicional no lado direito da desigualdade tende a zero. Reorganizar esta expressão leva a
P(Yn(ασ2μ+nμ)2)Φ(α)

Tomando raízes quadradas e observando que implica que , obtemos Em outras palavras, . Este resultado demonstra convergência para um gaussiano no limite como .μ>0P(Yn<0)0

P(|Yn|ασ2μ+nμ)Φ(α)
|Yn|nμσ/2μdN(0,1)n

Isso significa que é uma boa aproximação de para grande ? Bem, podemos fazer melhor que isso. Como @Henry observa, assumindo que tudo é positivo, podemos usar , juntamente com e a aproximação , para obter a aproximação aprimorada conforme indicado na pergunta acima. Observe também que ainda temos porquenμE[|Yn|]nE[Yn]=E[Yn]Var(Yn)E[Yn]=nμVar(Yn)σ24μE[|Yn|]nμσ24μ

|Yn|nμσ24μσ/2μdN(0,1)
nμσ24μnμ0 como .n
S. Catterall Restabelece Monica
fonte
Você pode precisar adicionar como para obter meu resultadonμnμσ24μ0n
Henry
@ Henry Você pode substituir por por qualquer constante e isso não altera a distribuição limitadora, mas pode alterar o grau em que é uma boa aproximação de para grande específico . Como você criou o ? nμnμkk|Yn|nμkσ/2μN(0,1)nnμσ24μ
S. Catterall Restabelece Monica
Temos então . Assumindo que tudo é positivo, enquanto o denominador de sugere e combinando esses leads em . Var(Z)=E[Z2](E[Z])2E[Z]=E[Z2]Var(Z)E[Z2]=E[Y]=nμ|Yn|nμσ/2μ E[Z]Var(Z)σ24μE[Z]nμσ24μ
Henry
Ok, obrigado, eu tentei cobrir isso na minha resposta agora.
S. Catterall Restabelece Monica