Compreendendo o teste do qui-quadrado e a distribuição do qui-quadrado

13

Estou tentando entender a lógica por trás do teste do qui-quadrado.

O teste do qui-quadrado é . χ2é então comparado a uma distribuição qui-quadrado para descobrir um valor p.a fim de rejeitar ou não a hipótese nula. H0: as observações vêm da distribuição que usamos para criar nossos valores esperados. Por exemplo, poderíamos testar se a probabilidade de obteré dada porp,como esperamos. Então jogarmos 100 vezes e encontrarnHe1-nH. Queremos comparar nossa descoberta com o que é esperado (100p). Poderíamos também usar uma distribuição binomial, mas esse não é o objetivo da pergunta ... A questão é:χ2=(obsexp)2expχ2H0headpnH Heads1nH tails100p

Você pode explicar por que, sob a hipótese nula, segue uma distribuição qui-quadrado?(obsexp)2exp

Tudo o que sei sobre a distribuição qui-quadrado é que a distribuição qui-quadrado do grau é a soma da distribuição normal padrão de k ao quadrado.kk

Remi.b
fonte
2
Não faz: é uma aproximação. Muito mais sobre isso aparece no tópico stats.stackexchange.com/questions/16921/… .
whuber
Isso pode ser de interesse Karl Pearson e o teste do qui-quadrado (Placket, 1983) {pdf}
Avraham
Uma pergunta relacionada sobre por que a distribuição qui-quadrado é usada para testes de qualidade de ajuste, embora não seja uma duplicata: stats.stackexchange.com/questions/125312/…
Silverfish

Respostas:

12

Poderíamos também usar uma distribuição binomial, mas esse não é o ponto da questão…

No entanto, é o nosso ponto de partida, mesmo para a sua pergunta real. Vou abordar isso de maneira informal.

Vamos considerar com o caso binomial de maneira mais geral:

YBin(n,p)

Suponha que e p sejam tais que Y seja bem aproximado por um normal com a mesma média e variância (alguns requisitos típicos são menores que min ( n p , n ( 1 - p ) ) não são pequenos ou que n p ( 1 - p ) não é pequeno).npYmin(np,n(1p))np(1p)

Então será aproximadamente χ 2 1 . Aqui Y(YE(Y))2/Var(Y)χ12Y é o número de sucessos.

E(Y)=npVar(Y)=np(1p)

npH0

(Ynp)2/np(1p)χ12.

Note that (Ynp)2=[(nY)n(1p)]2. Also note that 1p+11p=1p(1p).

Hence (Ynp)2np(1p)=(Ynp)2np+(Ynp)2n(1p)=(Ynp)2np+[(nY)n(1p)]2n(1p)=(OSES)2ES+(OFEF)2EF

Which is just the chi-square statistic for the binomial case.

So in that case the chi-square statistic should have the distribution of the square of an (approximately) standard-normal random variable.

Glen_b -Reinstate Monica
fonte