Ainda outra questão do teorema do limite central

11

Seja uma sequência de variáveis ​​aleatórias independentes de Bernoulli com Defina Mostre que converge na distribuição para a variável normal padrão pois tende ao infinito.P { X k = 1 } = 1 - P { X k = 0 } = 1{Xn:n1}Sn= n k=1(Xk-1

P{Xk=1}=1P{Xk=0}=1k.
Sn
Sn=k=1n(Xk1k), Bn2=k=1nk1k2
ZnSnBnZn

Minha tentativa é usar o Lyapunov CLT, portanto, precisamos mostrar que existe um tal que, δ>0

limn1Bn2+δk=1nE[|Xk1k|2+δ]=0.

Então defina δ=1

k=1nE|Xkk1|3=k=1n(1k3k2+4k32k4)
e
Bn3=(k=1n1k1k2)(k=1n1k1k2)

Ao avaliar n's grandes no computador, ele mostra como k=1nE|Xkk1|3 e Bn3 como n . Mas Bn3 aumenta mais rápido que Bn2 então k=1nE|Xkk1|3Bn30 . Alguém pode me ajudar a provar que essa convergência é válida?

TiffanyBorboletas
fonte
7
Este é o Exemplo 27.3 de Probabilidade e Medida, de Patrick Billingsley.
Zhanxiong 27/03

Respostas:

10

Pode ser instrutivo demonstrar esse resultado a partir dos primeiros princípios e resultados básicos , explorando propriedades das funções geradoras cumulantes (exatamente como nas provas padrão do Teorema do Limite Central). Isso requer que entendamos a taxa de crescimento de números harmônicos generalizados para Essas taxas de crescimento são bem conhecidas e facilmente obtidas por comparação com as integrais : elas convergem para e divergem logaritmicamente para . s = 1 ,

H(n,s)=k=1nks
n 1 X - s d x s > 1 s = 1s=1,2,.1nxsdxs>1s=1

Seja e . Por definição, a função de geração cumulativa (cgf) de é1 k n ( X k - 1 / k ) / B nn21kn(Xk1/k)/Bn

ψk,n(t)=logE(exp(Xk1/kBnt))=tkBn+log(1+1+exp(t/Bn)k).

A expansão em série do lado direito, obtida a partir da expansão de torno de , assume a formaz = 0log(1+z)z=0

ψk,n(t)=(k1)2k2Bn2t2+k23k+26k3Bn3t3++kj1±(j1)!j!kjBnjtj+.

Os numeradores das frações são polinômios em com o termo inicial . Como a expansão do log converge absolutamente para , essa expansão converge absolutamente quandokkj1|1+exp(t/Bn)k|<1

|exp(t/Bn)1|<k.

(No caso de , convergir para todos os lugares.) Para valores fixos de e crescentes de , a divergência (óbvia) de implica que o domínio da convergência absoluta se torna arbitrariamente grande. Assim, para qualquer fixo e suficientemente grande , esta expansão converge absolutamente.k=1knBntn

Para suficientemente grande , então, podemos, portanto, somar o indivíduo sobre termo por termo em potências de para obter o cgf de ,nψk,nktSn/Bn

ψn(t)=k=1nψk,n(t)=12t2++1Bnj(k=1n(k1±(j1)!kj))tjj+.

Assumir os termos nas somas sobre um de cada vez exige que avaliemos expressões proporcionais ak

b(s,j)=1Bnjk=1nks

para e . Usando os assintóticos dos números harmônicos generalizados mencionados na introdução, segue-se facilmente dej3s=1,2,,j

Bn2=H(n,1)H(n,2)log(n)

naquela

b(1,j)(log(n))1j/20

e (para )s>1

b(s,j)(log(n))j/20

como cresce. Consequentemente, todos os termos na expansão de além de convergem para zero, de onde converge para para qualquer valor de . Como a convergência do cgf implica a convergência da função característica, concluímos pelo Teorema da Continuidade de Levy que aproxima de uma variável aleatória cujo cgf é 2/2 : essa é a variável normal padrão, QED .nψn(t)t2ψn(t)t2/2tSn/Bnt2/2


Essa análise revela quão delicada é a convergência: enquanto em muitas versões do Teorema do Limite Central o coeficiente de é (para ), aqui o coeficiente é somente : a convergência é muito mais lenta.Neste sentido, a sequência de variáveis ​​padronizadas "apenas um pouco" se torna Normal.tjO(n1j/2)j3O(((log(n))1j/2)

Podemos ver essa lenta convergência em uma série de simulações. Os histogramas exibem iterações independentes para quatro valores de . As curvas vermelhas são gráficos de funções de densidade normal padrão para referência visual. Embora exista evidentemente uma tendência gradual à normalidade, mesmo em (onde ainda é considerável), permanece uma não normalidade considerável, como evidenciado na assimetria (igual a nesta amostra). (Não é surpresa que a assimetria desse histograma esteja próxima de , porque é exatamente isso que é o termo no cgf.) n n = 1000105nn=1000(log(n))1/20.380.35(log(n))1/2t3

Figura: histogramas para n = 30, 100, 300, 1000

Aqui está o Rcódigo para aqueles que gostariam de experimentar ainda mais.

set.seed(17)
par(mfrow=c(1,4))
n.iter <- 1e5
for(n in c(30, 100, 300, 1000)) {
  B.n <- sqrt(sum(rev((((1:n)-1) / (1:n)^2))))
  x <- matrix(rbinom(n*n.iter, 1, 1/(1:n)), nrow=n, byrow=FALSE)
  z <- colSums(x - 1/(1:n)) / B.n
  hist(z, main=paste("n =", n), freq=FALSE, ylim=c(0, 1/2))
  curve(dnorm(x), add=TRUE, col="Red", lwd=2)
}
whuber
fonte
6

Você já tem uma ótima resposta. Se você também deseja concluir sua própria prova, pode argumentar da seguinte maneira:

Como converge para todos e diverge para ( aqui ), podemos escreverk=1n1/kii>1i=1

S(n):=k=1n(1k3k2+4k33k4)=k=1n1k+O(1).

Pelo mesmo argumento,

Bn2=k=1n1k+O(1).

Conseqüentemente, e, portanto,S(n)/Bn2=O(1)

S(n)/Bn3=O(1)(Bn2)1/20,

que é o que queríamos mostrar.

ekvall
fonte
2

Primeiro, suas variáveis ​​aleatórias não serão distribuídas de forma idêntica se as distribuições dependerem de ;)k

Também não usaria sua notação como:Bn

  • letras maiúsculas são geralmente reservadas para variáveis ​​aleatórias.
  • é apenas a soma das variações, então eu usaria uma notação envolvendo um símbolo para tornar isso óbvio.σ

Então, com relação à pergunta, não sei se isso é um exercício ou pesquisa e quais ferramentas você pode usar. Se você não está tentando provar novamente os teoremas conhecidos, eu diria que é um teorema do limite central para RV independente, não identicamente distribuído, mas uniformemente limitado, e o chame de um dia. Não tenho uma boa fonte em mãos, mas não deve ser muito difícil encontrar uma, por exemplo, consulte /mathpro/29508/is-there-a-central-limit-theorem- para aleatório-limitado-não-identicamente-distribuído .

Edit: Meu mal, é claro que a condição uniformemente limitada não é suficiente, você também precisa

k=1nσk2
Adrien
fonte