Vamos ser desenhado iid de uma distribuição t de Student com graus de liberdade, de tamanho moderado (digamos, menos de 100). Defina é distribuído quase como um qui-quadrado com graus de liberdade? Existe algo como o Teorema do Limite Central para a soma das variáveis aleatórias ao quadrado?
chi-squared
central-limit-theorem
t-distribution
shabbychef
fonte
fonte
Respostas:
Respondendo à primeira pergunta.
Podemos começar pelo fato observado por mpiktas, que . E tente primeiro um passo mais simples - procure a distribuição de uma soma de duas variáveis aleatórias distribuídas por F ( 1 , n ) . Isso pode ser feito calculando a convolução de duas variáveis aleatórias ou calculando o produto de suas funções características.t2∼F(1,n) F(1,n)
O artigo do PCB Phillips mostra que meu primeiro palpite sobre "funções hipergeométricas [confluentes] envolvidas") foi realmente verdadeiro. Isso significa que a solução não será trivial e a força bruta é complicada, mas condição necessária para responder à sua pergunta. Portanto, como é fixo e você resume distribuições t, não podemos dizer com certeza qual será o resultado final. A menos que alguém tenha uma boa habilidade brincando com produtos de funções hipergeométricas confluentes.n
fonte
Não é nem uma aproximação aproximada. Para pequeno , a expectativa de T é igual a k nn T enquanto que a expectativa deχ2(k)é igual ak. Quandoké pequeno (menos de 10, digamos), os histogramas delog(T)e delog(χ2(k))nem têm a mesma forma, indicando queT demudança e reescalonamentoainda não funcionará.knn−2 χ2(k) k k log(T) log(χ2(k)) T
Intuitivamente, para pequenos graus de liberdade, o de Student é pesado. A quadratura enfatiza esse peso. Portanto, as somas serão mais distorcidas - geralmente muito mais distorcidas - do que somas de normais ao quadrado (a distribuição do χ 2 ). Cálculos e simulações confirmam isso.t χ2
Ilustração (conforme solicitado)
Cada histograma representa uma simulação independente de 100.000 tentativas com os graus de liberdade especificados ( ) e somatórios ( k ), padronizados conforme descrito por @mpiktas. O valor de n = 9999 na linha inferior se aproxima do caso χ 2 . Assim, você pode comparar T a χ 2 pesquisando cada coluna.n k n=9999 χ2 T χ2
Observe que a padronização não é possível para porque os momentos apropriados nem existem. A falta de estabilidade da forma (conforme você escaneia da esquerda para a direita em qualquer linha ou de cima para baixo em qualquer coluna) é ainda mais acentuada para n ≤ 4 .n<5 n≤4
fonte
Eu vou responder a segunda pergunta. O teorema do limite central é para qualquer sequência iid, ao quadrado ou não ao quadrado. Portanto, no seu caso, se for suficientemente grande, temosk
onde e V a r ( t 2 1 ) são respectivamente a média e a variação da distribuição quadrada de Student t com n graus de liberdade. Observe que t 2 1 é distribuído como distribuição F com 1 e n graus de liberdade. Assim, podemos pegar as fórmulas para média e variância na página da Wikipedia . O resultado final é então:Et21 Var(t21) n t21 1 n
fonte