Por que o teste de McNemar usa o qui-quadrado e não a distribuição normal?

11

Acabei de notar como o teste não exato de McNemar usa a distribuição assintótica do quadrado do qui. Mas como o teste exato (para a tabela de dois casos) se baseia na distribuição binomial, como é comum sugerir a aproximação normal à distribuição binomial?

Obrigado.

Tal Galili
fonte

Respostas:

15

Uma resposta quase intuitiva:

Dê uma olhada na fórmula do teste de McNemar, dada a tabela

      pos | neg
----|-----|-----
pos |  a  |  b
----|-----|-----
neg |  c  |  d

A estatística McNemar Mé calculada como:

M=(bc)2b+c

A definição de uma com k graus de liberdade é que ela consiste na soma dos quadrados de k variáveis ​​normais padrão independentes. se os 4 números forem grandes o suficiente e , portanto, e puderem ser aproximados por uma distribuição normal. Dada a fórmula para M, é fácil ver que com valores suficientemente grandes seguirá aproximadamente uma com 1 grau de liberdade.χ2bcb-cb+cMχ2


EDIT: Como indicado no início, a aproximação normal é de fato completamente equivalente. Isso é trivial, dado o argumento usando a aproximação da b-cdistribuição normal.

A versão binomial exata também é equivalente ao teste de sinal, no sentido de que nesta versão a distribuição binomial é usada para comparar bcom o . Ou podemos dizer que, sob a hipótese nula, a distribuição de b pode ser aproximada por .Binom(b+c,0.5)N(0.5×(b+c),0.52×(b+c)

Ou equivalente:

b(b+c2)b+c2N(0,1)

o que simplifica a

bcb+cN(0,1)

ou, quando tomado o quadrado de ambos os lados, para .Mχ12

Portanto, a aproximação normal é usada. É o mesmo que a aproximação .χ2

Joris Meys
fonte
3
Está certo. Talvez a conexão possa ser vista mais claramente considerando Sqrt (M) = (bc) / Sqrt (b + c). Aproximando a variação de b como be a variação de c como c (como é habitual com dados contados), vemos que Sqrt (M) se parece com uma variável aproximadamente normal (bc) dividida por seu desvio padrão: em outras palavras, parece uma variável normal padrão . De fato, poderíamos realizar um teste equivalente referindo Sqrt (M) a uma tabela da distribuição normal padrão. Esquadrar efetivamente torna o teste simétrico de duas caudas. Obviamente, isso quebra se b ou c for pequeno.
whuber
Obrigado pela resposta intuitiva Joris. Ainda assim, por que é mais comum usar essa aproximação do que usar a aproximação normal para o teste binomial exato de McNemar?
precisa
@ Tal: É o mesmo. Veja a resposta sem parar e minha edição.
precisa
Na verdade - última pergunta. Então, se os dois são idênticos (e acho que você também pode precisar de um "valor absoluto" em torno do aC), então por que as pessoas vão para a distribuição chi em vez de ficar com a normal? Onde está a vantagem?
precisa
1
@ Tal: Você sabe que R. traça o chi2 com um grau de liberdade, verá.
Joris Meys
8

As duas abordagens não chegarão à mesma coisa? A distribuição qui-quadrado relevante tem um grau de liberdade, assim como simplesmente a distribuição do quadrado de uma variável aleatória com uma distribuição normal padrão. Eu teria que examinar a álgebra para verificar, o que não tenho tempo para fazer agora, mas ficaria surpreso se você não terminar exatamente com a mesma resposta nos dois sentidos.

uma parada
fonte
veja minha resposta para uma elaboração mais aprofundada
Joris Meys
Oi onestop - Como os dois são assintóticos, os N's menores podem gerar resultados um pouco diferentes. Nesse caso, eu me pergunto se a escolha de ir com o qui-quadrado é porque é melhor do que a aproximação normal, ou por razões históricas (ou talvez, como você sugeriu - elas sempre produzem resultados idênticos)
Tal Galili
@ Tal: para N menor, nenhum dos dois espera. E, como mostrado na minha edição, eles são exatamente os mesmos.
precisa