Estou tentando entender a lógica por trás do teste do qui-quadrado.
O teste do qui-quadrado é . χ2é então comparado a uma distribuição qui-quadrado para descobrir um valor p.a fim de rejeitar ou não a hipótese nula. H0: as observações vêm da distribuição que usamos para criar nossos valores esperados. Por exemplo, poderíamos testar se a probabilidade de obteré dada porp,como esperamos. Então jogarmos 100 vezes e encontrarnHe1-nH. Queremos comparar nossa descoberta com o que é esperado (100⋅p). Poderíamos também usar uma distribuição binomial, mas esse não é o objetivo da pergunta ... A questão é:head
Heads
tails
Você pode explicar por que, sob a hipótese nula, segue uma distribuição qui-quadrado?
Tudo o que sei sobre a distribuição qui-quadrado é que a distribuição qui-quadrado do grau é a soma da distribuição normal padrão de k ao quadrado.
Respostas:
No entanto, é o nosso ponto de partida, mesmo para a sua pergunta real. Vou abordar isso de maneira informal.
Vamos considerar com o caso binomial de maneira mais geral:
Suponha que e p sejam tais que Y seja bem aproximado por um normal com a mesma média e variância (alguns requisitos típicos são menores que min ( n p , n ( 1 - p ) ) não são pequenos ou que n p ( 1 - p ) não é pequeno).n p Y min(np,n(1−p)) np(1−p)
Então será aproximadamente ∼ χ 2 1 . Aqui Y(Y−E(Y))2/Var(Y) ∼χ21 Y é o número de sucessos.
Note that(Y−np)2=[(n−Y)−n(1−p)]2 . Also note that 1p+11−p=1p(1−p) .
Hence(Y−np)2np(1−p)=(Y−np)2np+(Y−np)2n(1−p)=(Y−np)2np+[(n−Y)−n(1−p)]2n(1−p)=(OS−ES)2ES+(OF−EF)2EF
Which is just the chi-square statistic for the binomial case.
So in that case the chi-square statistic should have the distribution of the square of an (approximately) standard-normal random variable.
fonte