Como a estatística qui-quadrado do Pearson se aproxima de uma distribuição qui-quadrado

10

Portanto, se a estatística qui-quadrado de Pearson for fornecida para uma tabela , sua forma será:1 1×N

Eu=1 1n(OEu-EEu)2EEu

Então isso se aproxima de , a distribuição qui-quadrado com graus de liberdade, à medida que o tamanho da amostra aumenta. n - 1 Nχn-1 12n-1 1N

O que não entendo é como essa aproximação assintótica funciona. Eu sinto que os 's nos denominadores devem ser substituídos por . Como isso daria a você , para . Mas é claro que isso tem graus de liberdade, não n-1 , então claramente algo mais está acontecendo.s 2 iEEu × 2 n =Σ n i = 1 Z 2 i Zi~N(0,1)nn-1sEu2nEuχn2=Eu=1 1nZEu2ZEun(0 0,1 1)nn-1 1

Thoth
fonte
Embora isso não responda à sua pergunta , pode esclarecer isso.
whuber

Respostas:

11

Vou motivar isso intuitivamente e indicar como isso ocorre no caso especial de dois grupos, supondo que você esteja feliz em aceitar a aproximação normal do binômio.

Espero que isso seja suficiente para você ter uma boa noção de por que funciona da maneira que funciona.

Você está falando sobre o teste qui-quadrado da qualidade do ajuste. Digamos que haja grupos (você o tem como , mas há uma razão pela qual prefiro chamá-lo de ).n kknk

No modelo que está sendo aplicado para essa situação, as contagens , são multinomiais .OEuEu=1 1,2,...,k

Seja . As contagens estão condicionadas à soma (exceto em algumas situações bastante raras); e há um conjunto pré-especificado de probabilidades para cada categoria, , que somam . N p i , i = 1 , 2 , , kN=Eu=1 1kOEuNpEu,Eu=1 1,2,,k1 1

Assim como no binômio, há uma aproximação normal assintótica para multinômios - de fato, se você considerar apenas a contagem em uma determinada célula ("nesta categoria" ou não), ela seria binomial. Assim como no binômio, as variações das contagens (assim como suas covariâncias no multinomial) são funções de e ; você não estima uma variação separadamente.pNp

Ou seja, se as contagens esperadas forem suficientemente grandes, o vetor de contagens é aproximadamente normal com a média . No entanto, como as contagens são condicionadas a , a distribuição é degenerada (existe em um hiperplano de dimensão , pois especificar das contagens corrige a remanescente). A matriz de variância-covariância possui entradas diagonais e elementos diagonais desativados , e possui classificação devido à degeneração. N k - 1 k - 1 N p i ( 1 - p i ) - N p i p j k - 1EEu=NpEuNk-1 1k-1 1NpEu(1 1-pEu)-NpEupjk-1 1

Como resultado, para uma célula individual , e você pode escrever . No entanto, os termos são dependentes (correlacionados negativamente), portanto, se você somar os quadrados desses , não terá a (como teria se fossem variáveis ​​padronizadas independentes). Em vez disso, poderíamos potencialmente construir um conjunto de variáveis ​​independentes partir do original, que são independentes e ainda aproximadamente normais (assintoticamente normais). Se somarmos seus quadrados (padronizados), obteríamos a . Existem maneiras de construir esse conjunto dez i = O i - E iVar(OEu)=NpEu(1 1-pEu) ziχ2kk-1kχ2k-1k-1zEu=OEu-EEuEEu(1 1-pEu)zEuχk2k-1 1kχk-1 12k-1 1 variáveis ​​explicitamente, mas, felizmente, existe um atalho muito elegante que evita uma quantidade substancial de esforço e produz o mesmo resultado (o mesmo valor da estatística) como se tivéssemos enfrentado o problema.

Considere, por simplicidade, uma qualidade de ajuste com duas categorias (que agora é binomial). A probabilidade de estar na primeira célula é , e na segunda célula é . Existem observações na primeira célula e na segunda célula.p 2 = 1 - p X = O 1 N - X = O 2p1 1=pp2=1 1-pX=O1 1N-X=O2

A primeira contagem de células observada, é assintoticamente . Podemos padronizá-lo como . Então é aproximadamente (assintoticamente ).N ( N p , N p ( 1 - p ) ) z = X - N pXN(Np,Np(1 1-p)) z2=(X-Np)2z=X-NpNp(1 1-p)χ 2 1χ 2 1z2=(X-Np)2Np(1 1-p)χ1 12χ1 12

Notar que

Eu=1 12(OEu-EEu)2EEu=[X-Np]2Np+[(N-X)-(N-Np)]2N(1 1-p)=[X-Np]2Np+[X-Np]2N(1 1-p)=(X-Np)2[1 1Np+1 1N(1 1-p)] .

Mas

1 1Np+1 1N(1 1-p)=Np+N(1 1-p)Np.N(1 1-p)=1 1Np(1 1-p) .

Então que é começamos com - que assintoticamente será uma variável aleatória . A dependência entre as duas células é tal que, ao mergulharmos por vez de , compensamos exatamente a dependência entre as duas e obtemos a variável aleatória quadrada-de-uma-aproximadamente-normal original. z2χ 2 1 EiEi(1-pi)Eu=1 12(OEu-EEu)2EEu=(X-Np)2Np(1 1-p)z2χ1 12EEuEEu(1 1-pEu)

O mesmo tipo de dependência-soma é pela mesma abordagem quando há mais de duas categorias - somando o vez de em todos os termos, você compensa exatamente o efeito da dependência e obtém uma soma equivalente a uma soma dos normais independentes . (Oi-Ei)2(OEu-EEu)2EEu kk-1(OEu-EEu)2EEu(1 1-pEu)kk-1 1

Existem várias maneiras de mostrar que a estatística tem uma distribuição que assintoticamente para maior (é abordada em alguns cursos de estatística de graduação e pode ser encontrada em vários textos de nível de graduação), mas não quero levar você muito além do nível sugerido pela sua pergunta. De fato, é fácil encontrar derivações em notas na internet, por exemplo, existem duas derivações diferentes no espaço de duas páginas aqui kχk-1 12k

Glen_b -Reinstate Monica
fonte
Obrigado, isso faz sentido. Isso é uma coincidência / acidente matemático que funciona tão bem para ser apenas uma divisão pelo valor esperado? ou existe uma explicação estatística intuitiva para que esse seja o caso?
Thoth
Existem várias explicações que podem ou não ser intuitivas, dependendo de coisas que variam de pessoa para pessoa. Por exemplo, se as contagens observadas fossem originalmente variáveis ​​independentes de Poisson, a variação para levaria você a dividir por (e o Poisson também é assintoticamente normal). Se você condicionar o total (como acima), obterá multinomial. Se você condiciona o total ou não (por exemplo, se você o trata como Poisson ou multinomial), o estimador de ML é o mesmo e, portanto, a variação desse estimador é a mesma - (ctd)E izEEu
Glen_b
(ctd) ... Como resultado, você deve dividir por e a variação deve sair exatamente correta. [Você ainda tem apenas df.] k - 1EEuk-1 1
Glen_b -Reinstala Monica 20/08/14
0

O manuscrito de uma página http://sites.stat.psu.edu/~dhunter/asymp/lectures/p175to184.pdf referido pelo usuário @Glen_b finalmente mostra que a estatística pode ser reescrita como Hotelling com classificação de covariância = (ver eq. 9.6). Podemos então invocar um resultado clássico de SJ Sepanski (1994) para obter sua distribuição assintótica como um qui-quadrado com graus de liberdade.T2k-1 1k-1 1

dohmatob
fonte