Por que o teste do qui-quadrado usa a contagem esperada como variação?

18

No , qual é a base para usar a raiz quadrada das contagens esperadas como os desvios padrão (isto é, as contagens esperadas como as variações) de cada uma das distribuições normais? A única coisa que pude encontrar discutindo isso é o http://www.physics.csbsju.edu/stats/chi-square.html , e apenas menciona as distribuições de Poisson.χ2

Como uma ilustração simples da minha confusão, e se estivéssemos testando se dois processos são significativamente diferentes, um que gera 500 As e 500 Bs com variância muito pequena e outro que gera 550 As e 450 Bs com variância muito pequena (raramente gerando 551 As e 449 Bs)? A variação aqui não é claramente o valor esperado?

(Não sou estatístico, estou realmente procurando uma resposta que seja acessível a quem não é especialista.)

Yang
fonte
Provavelmente isso tem algo a ver com o fato de que a variação aleatória de uma variável aleatória é e também com o fato de que a estatística deve ser multiplicada por 2 para ter a distribuição correta (como no exemplo teste de razão de verossimilhança). Talvez alguém saiba disso mais formalmente. 2 kχk22k
Macro

Respostas:

16

A forma geral para muitas estatísticas de teste é

observed-expectedstumandumarderror

No caso de uma variável normal, o erro padrão é baseado na variação populacional conhecida (estatísticas z) ou na estimativa da amostra (estatísticas t). Com o binomial, o erro padrão é baseado na proporção (proporção hipotética para testes).

Em uma tabela de contingência, a contagem em cada célula pode ser vista como proveniente de uma distribuição de Poisson com uma média igual ao valor esperado (abaixo do nulo). A variação para a distribuição de Poisson é igual à média, portanto, usamos o valor esperado também para o cálculo do erro padrão. Vi uma estatística que usa o observado em vez disso, mas tem menos justificativa teórica e não converge também para a distribuição do .χ2

Greg Snow
fonte
1
Estou ficando preso na conexão com o Poisson / entendendo por que cada célula pode ser pensada como proveniente de um Poisson. Conheço a média / variância de Poissons e sei que elas representam o número de eventos que recebem uma taxa. Eu também sei que as distribuições qui-quadrado representam a soma dos quadrados das normais padrão (variância 1). Só estou tentando entender a justificativa de reutilizar o valor esperado como uma suposição da "propagação" de cada normal. Isso é apenas para tornar tudo conforme a distribuição do qui-quadrado / "padronizar" as normais?
Yang
3
Existem alguns problemas: a distribuição de Poisson é comum para contagens quando as coisas são razoavelmente independentes. Em vez de pensar na tabela como tendo um total fixo e você estiver distribuindo os valores entre as células da tabela, pense em apenas uma célula da tabela e aguarde um tempo fixo para ver quantas respostas caem nessa célula , isso se encaixa na idéia geral do Poisson. Para médias grandes, é possível aproximar um Poisson com uma distribuição normal, portanto a estatística de teste faz sentido como uma aproximação normal ao Poisson e depois converter para . χ2
Greg Neve
1
(+1) Suponha que a célula conta eram variáveis ​​aleatórias independentes de Poisson com média n π i . Então, certamente, Σ k i = 1 ( X i - n π i ) 2Xi,,Xknπi na distribuição. Mas, o problema disso é quené umparâmetroe não a contagem real observada. As contagens totais observadas sãoN= k i = 1 XiPoi(n). EmboraN/n1quase certamente pelo SLLN, mais trabalho tenha que ser feito para transformar a heurística em algo viável. i=1k(Xinπi)2nπiχk2nN=i=1kXiPoi(n)N/n1
cardeal
Como uma ilustração simples da minha confusão, e se estivéssemos testando se dois processos são significativamente diferentes, um que gera 500 As e 500 Bs com variância muito pequena e outro que gera 550 As e 450 Bs com variância muito pequena (raramente gerando 551 As e 449 Bs)? A variação aqui não é claramente o valor esperado?
Yang
1
@ Yang: Parece que seus dados - que você não descreveu - não estão em conformidade com o modelo subjacente ao uso da estatística qui-quadrado. O modelo padrão é de amostragem multinomial . A rigor, nem mesmo a amostragem (incondicional) de Poisson é abordada, o que a resposta de Greg supõe. Faço referência (talvez obtusa) a isso no meu comentário anterior.
cardeal
17

Vamos tratar do caso mais simples para tentar fornecer o máximo de intuição. Seja uma amostra iid de uma distribuição discreta com k resultados. Seja π 1 , , π k as probabilidades de cada resultado específico. Estamos interessados ​​na distribuição (assintótica) da estatística qui-quadrado X 2 = k i = 1 ( S i - n π i ) 2X1,X2,,Xnkπ1,...,πk Aqui n π i é o número esperado de contagens do i th resultado.

X2=Eu=1k(SEu-nπEu)2nπEu.
nπEuEu

Uma heurística sugestiva

Defina , de modo queX2=ΣiL 2 i =L 2 2 em queL=(U1,...,Lk).vocêEu=(SEu-nπEu)/nπEuX2=EuvocêEu2=__você__22você=(você1,...,vocêk)

Como é B i n ( n , π i ) , então pelo Teorema do Limite Central , T i = U iSEuBEun(n,πEu) portanto, também temos isso, U i d N ( 0 , 1 - π i ) .

TEu=vocêEu1-πEu=SEu-nπEunπEu(1-πEu)dN(0 0,1),
vocêEudN(0 0,1-πEu)

Agora, se o foram (assintoticamente) independente (que não são), então poderíamos argumentar que Σ i T 2 i foi asymptotically χ 2 k distribuído. Mas, nota que T k é uma função determinística de ( T 1 , ... , T k - 1 ) e assim os T i variáveis não pode ser independente.TEuEuTEu2χk2Tk(T1,...,Tk-1)TEu

Portanto, devemos levar em conta a covariância entre eles de alguma forma. Acontece que a maneira "correta" de fazer isso é usar o vez, e a covariância entre os componentes de U também altera a distribuição assintótica do que poderíamos ter pensado que era χ 2 k para o que é, de fato, a χ 2 k - 1 .vocêEuvocêχk2χk-12

Alguns detalhes sobre isso a seguir.

Um tratamento mais rigoroso

Não é difícil verificar se, de fato, Cov(vocêEu,vocêj)=-πEuπjEuj

você

UMA=Eu-ππT,
π=(π1,...,πk)UMAUMA=UMA2=UMATZ=(Z1,...,Zk)UMAZN(0 0,UMA)

você0 0UMA

vocêUMAZX2=vocêTvocêZTUMATUMAZ=ZTUMAZ

UMArumank(UMA)UMAUMA=QDQTQDrumank(UMA)

ZTUMAZχk-12UMAk-1

Outras conexões

A estatística do qui-quadrado também está intimamente relacionada à estatística da razão de verossimilhança. De fato, é uma estatística de pontuação Rao e pode ser vista como uma aproximação da série de Taylor da estatística da razão de verossimilhança.

Referências

Este é o meu próprio desenvolvimento baseado na experiência, mas obviamente influenciado por textos clássicos. Bons lugares para procurar aprender mais são

  1. GAF Seber e AJ Lee (2003), Linear Regression Analysis , 2ª ed., Wiley.
  2. E. Lehmann e J. Romano (2005), Testing Statistical Hypotheses , 3a ed., Springer. Seção 14.3 em particular.
  3. DR Cox e DV Hinkley (1979), Estatística Teórica , Chapman e Hall.
cardeal
fonte
(+1) Penso que é difícil encontrar essa prova em textos padrão de análise de dados categóricos como Agresti, A. (2002). Análise de dados categóricos. John-Wiley.
suncoolsu
Obrigado pelo comentário. Sei que há algum tratamento da estatística do qui-quadrado em Agresti, mas não me lembro até que ponto ele a leva. Ele pode apenas apelar para a equivalência assintótica com a estatística da razão de verossimilhança.
cardeal
k-1
XS