Uma versão muito simples do teorema limitado central, como abaixo que é o CLT de Lindeberg – Lévy. Não entendo por que existe um no lado esquerdo. E o Lyapunov CLT diz mas por que não \ sqrt {s_n} ? Alguém me diria quais são esses fatores, como \ sqrt {n} e \ frac {1} {s_n} ? como os colocamos no teorema?√n ( ( 1n n ∑ i=1Xi)-μ) d → N(0, σ 2 )
central-limit-theorem
intuition
Porco voador
fonte
fonte
Respostas:
Boa pergunta (+1) !!
Você lembrará que, para variáveis aleatórias independentes e , e . Portanto, a variação de é , e a variação de é .XX YY Var(X+Y)=Var(X)+Var(Y)Var(X+Y)=Var(X)+Var(Y) Var(a⋅X)=a2⋅Var(X)Var(a⋅X)=a2⋅Var(X) ∑ni=1Xi∑ni=1Xi ∑ni=1σ2=nσ2∑ni=1σ2=nσ2 ˉX=1n∑ni=1XiX¯=1n∑ni=1Xi nσ2/n2=σ2/nnσ2/n2=σ2/n
Isto é para a variação . Para padronizar uma variável aleatória, você a divide por seu desvio padrão. Como você sabe, o valor esperado de é , então a variávelˉXX¯ μμ
ˉX−E(ˉX)√Var(ˉX)=√nˉX−μσ
Com relação ao seu segundo ponto, acredito que a equação mostrada acima ilustra que você precisa dividir por e não para padronizar a equação, explicando por que você usa (o estimador de e não .σσ √σσ−−√ snsn σ)σ) √snsn−−√
Adição: @whuber sugere discutir o porquê da escala . Ele faz isso lá , mas como a resposta é muito longa, tentarei capturar a essência de seu argumento (que é uma reconstrução dos pensamentos de De Moivre).√nn−−√
Se você adicionar um grande número de + 1 e -1, poderá aproximar a probabilidade de que a soma seja por contagem elementar. O log desta probabilidade é proporcional a . Portanto, se quisermos que a probabilidade acima converja para uma constante à medida que aumenta, precisamos usar um fator de normalização em .nn jj −j2/n−j2/n nn O(√n)O(n−−√)
Usando ferramentas matemáticas modernas (post de Moivre), você pode ver a aproximação mencionada acima observando que a probabilidade procurada é
P(j)=(nn/2+j)2n=n!2n(n/2+j)!(n/2−j)!
que aproximamos pela fórmula de Stirling
P(j)≈nnen/2+jen/2−j2nen(n/2+j)n/2+j(n/2−j)n/2−j=(11+2j/n)n+j(11−2j/n)n−j.
log(P(j))=−(n+j)log(1+2j/n)−(n−j)log(1−2j/n)∼−2j(n+j)/n+2j(n−j)/n∝−j2/n.
fonte
Existe uma boa teoria de que tipo de distribuições pode estar limitando as distribuições de somas de variáveis aleatórias. O recurso interessante é o seguinte livro de Petrov, do qual eu pessoalmente gostei imensamente.
Acontece que, se você está investigando limites desse tipo que são variáveis aleatórias independentes, as distribuições de limites são apenas certas distribuições.1ann∑i=1Xn−bn,(1)
Há muita matemática por aí, o que se resume a vários teoremas que caracterizam completamente o que acontece no limite. Um desses teoremas é devido a Feller:
Teorema Seja uma sequência de variáveis aleatórias independentes, seja a função de distribuição de e seja uma sequência de constante positiva. Para que{Xn;n=1,2,...}{Xn;n=1,2,...} Vn(x)Vn(x) XnXn anan
max1≤k≤nP(|Xk|≥εan)→0, for every fixed ε>0
e
supx|P(a−1nn∑k=1Xk<x)−Φ(x)|→0
é necessário e suficiente que
n∑k=1∫|x|≥εandVk(x)→0 for every fixed ε>0,
a−2nn∑k=1(∫|x|<anx2dVk(x)−(∫|x|<anxdVk(x))2)→1
e
a−1nn∑k=1∫|x|<anxdVk(x)→0.
Esse teorema dá uma idéia de como deve ser um .anan
A teoria geral do livro é construída de tal maneira que a constante normativa é restrita de qualquer forma, mas os teoremas finais que dão condições necessárias e suficientes não deixam espaço para constante normativa além de .√nn−−√
fonte
s representa o desvio padrão da amostra para a média da amostra. s é a variação da amostra para a média da amostra e é igual a S / n. Onde S é a estimativa amostral da variação populacional. Como s = S / √n explica como √n aparece na primeira fórmula. Observe que haveria um σ no denominador se o limite fossenn nn 22 nn 22 nn 22 nn nn
N (0,1), mas o limite é dado como N (0, σ ). Como S é uma estimativa consistente de σ, ela é usada na segunda equação para tirar σ fora do limite.22 nn
fonte
Intuitivamente, se Z n → N ( 0 , σ 2 ) para alguns σ 2 devemos esperar que Var ( Z n ) é aproximadamente igual a σ 2 ; parece uma expectativa bastante razoável, embora eu não ache necessário em geral. A razão para o √Zn→N(0,σ2) σ2 Var(Zn) σ2 n na primeira expressão é que a variação de ˉ X n-μvai para0como 1n−−√ X¯n−μ 0 ne então o√1n n está inflando a variação, de modo que a expressão apenas tenha variação igual aσ2. Na segunda expressão, o termosné definido como √n−−√ σ2 sn Σ n i = 1 Var ( X i ) enquanto que a variância do numerador cresce comoΣ n i = 1 Var(Xi), de modo que temos novamente que a variância de toda a expressão é uma constante (1neste caso).∑ni=1Var(Xi)−−−−−−−−−−−√ ∑ni=1Var(Xi) 1
Essencialmente, sabemos que algo "interessante" está acontecendo com a distribuição de ˉ X n : = 1n ∑iXi, mas se não o centralizarmos e dimensionarmos adequadamente, não conseguiremos vê-lo. Já ouvi isso descrito algumas vezes como necessidade de ajustar o microscópio. Se não explodirmos (por exemplo) ˉ X -μpor√X¯n:=1n∑iXi X¯−μ n então apenas temos ˉ X n-μ→0na distribuição pela lei fraca; um resultado interessante por si só, mas não tão informativo quanto o CLT. Se inflarmos por qualquer fatoranque é dominado por √n−−√ X¯n−μ→0 an n , ainda obtemosumn( ˉ X n-μ)→0enquanto qualquer fatoranque domina √n−−√ an(X¯n−μ)→0 an n dáumn( ˉ X n-μ)→∞. Acontece que √n−−√ an(X¯n−μ)→∞ n é apenas a ampliação correta para poder ver o que está acontecendo neste caso (nota: toda convergência aqui está em distribuição; há outro nível de ampliação que é interessante para uma convergência quase certa, que dá origem à lei da iteração logaritmo).n−−√
fonte