O Teorema do Limite Central multivariado (CLT) é válido quando as variáveis ​​exibem dependência contemporânea perfeita?

10

O título resume minha pergunta, mas para maior clareza, considere o seguinte exemplo simples. Deixe , i = 1, ..., n . Defina: \ begin {equação} S_n = \ frac {1} {n} \ sum_ {i = 1} ^ n X_i \ end {equação} e \ begin {equation} T_n = \ frac {1} {n} \ sum_ {i = 1} ^ n (X_i ^ 2 - 1) \ end {equation} Minha pergunta: Embora S_n e T_n sejam perfeitamente dependentes quando n = 1 , faça \ sqrt {n} S_n e \ sqrt {n} T_n convergem para uma distribuição normal conjunta como n \ rightarrow \ infty ?XiiidN(0,1)i=1,...,n

Sn=1ni=1nXi
Tn=1ni=1n(Xi21)
SnTnn=1nSnnTnn

A motivação: minha motivação para a pergunta decorre do fato de parecer estranho (mas maravilhoso) que Sn e Tn sejam perfeitamente dependentes quando n=1 , mas a implicação do CLT multivariado é que eles abordam a independência como n (isso aconteceria, já que Sn e Tn não estão correlacionados para todos os n ; portanto, se eles são normais assintoticamente comuns, eles também devem ser assintoticamente independentes).

Agradecemos antecipadamente por quaisquer respostas ou comentários!

ps, se você pode fornecer qualquer referência, etc, tanto melhor!

Colin T Bowers
fonte
Nenhuma resposta, mas um comentário. Não acho isso muito surpreendente. A dependência que você nota para n = 1 diminui rapidamente à medida que n aumenta.
Erik
@egbutter forneceu uma boa resposta. Se você ainda está procurando alguma intuição alternativa ou adicional, faça um ping e eu veremos como escrever algo um pouco diferente.
cardeal
@ cardinal Muito obrigado pela oferta, mas estou bastante feliz neste momento - concedeu a recompensa à egbutter. Eu acho que tenho a intuição. Meu principal objetivo na postagem era ver se alguém entrou e disse: "Não, não, você entendeu tudo errado por causa de ..." :-) Felicidades.
Colin T Bowers

Respostas:

6

A resposta curta, como eu entendo o seu q, é "sim, mas ..." as taxas de convergência em S, T e em qualquer outro momento não são necessariamente as mesmas - verifique os limites com o Teorema de Berry-Esseen .

Caso eu entenda mal o seu q, Sn e Tn se mantêm no CLT sob condições de fraca dependência (mistura): verifique o CLT da Wikipedia para processos dependentes .

CLT é um teorema geral - a prova básica requer nada mais do que a função característica de Sn e Tn converge para a função característica do padrão normal, então o Teorema da Continuidade de Levy diz que a convergência da função característica implica convergência da distribuição.

John Cook fornece uma ótima explicação do erro CLT aqui .

egbutter
fonte
Obrigado pela resposta. Não estou realmente preocupado com a taxa de convergência no que diz respeito a esta questão, nem se o CLT se manterá sob condições mais gerais, por exemplo, dependência. O que eu realmente esperava era uma referência ou afirmação que justificasse o uso da CLT multivariada quando o i-ésimo componente de cada soma exibisse perfeita dependência contemporânea. Posteriormente, encontrei uma referência na "Teoria dos limites estocásticos de Davidson", afirmando que as retenções multivariadas da CLT recebem uma dependência contemporânea arbitrária, mas ainda estou procurando um pouco de rigor em torno dessa afirmação.
Colin T Bowers
Parece que você está pensando demais nisso. Seu i está [1, n] nos componentes "contemporâneos" aos quais você está se referindo? Nesse caso, o ponto importante é que seu Sn e Tn ainda convergirão (você pode provar isso para si mesmo usando o mesmo método que a prova CLT da "velha escola" mencionada acima) - mas, para um dado i, seus erros serão ser diferente. Isso não muda o fato de que o CLT mantém. A distinção multi / univariada não é importante.
egbutter
Sim, os i são os componentes contemporâneos. Boa sugestão sobre como executar o exemplo por meio de uma prova. Na verdade, eu havia feito isso e não encontrei nenhum problema, o que paradoxalmente me deixou mais nervoso. Talvez eu esteja pensando demais nas coisas neste momento :-) Mais uma vez obrigado pela resposta. Se ninguém mais tiver uma rachadura na resposta até o final do dia, marcarei sua resposta como resposta. Felicidades.
Colin T Bowers
Certamente posso simpatizar - muitas vezes faço a mesma coisa! :)
egbutter
1

Isso não prova nada, é claro, mas eu sempre acho que fazer simulações e plotar gráficos é muito útil para entender os resultados teóricos.

Este é um caso particularmente simples. Geramos variates normais aleatórias e calcular e ; repita vezes. Os gráficos são representados por e . É fácil ver a dependência enfraquecendo à medida que aumenta; em o gráfico é quase indistinguível da independência.nSnTnmn=1,10,1001000nn=100

test <- function (m, n) 
{
    r <- matrix(rnorm(m * n), nrow = m)
    cbind(rowMeans(r), rowSums(r^2 - 1)/n)
}

par(mfrow=c(2,2))
plot(test(100, 1))
plot(test(100, 2))
plot(test(100, 5))
plot(test(100, 100))

insira a descrição da imagem aqui

Hong Ooi
fonte