Correção de continuidade de Yates para 2 x 2 tabelas de contingência

9

Gostaria de reunir informações de pessoas no campo sobre a correção da continuidade de Yates para tabelas de contingência 2 x 2. O artigo da Wikipedia menciona que pode se ajustar muito longe e, portanto, é usado apenas em um sentido limitado. O post relacionado aqui não oferece muito mais informações.

Então, para as pessoas que usam esses testes regularmente, quais são seus pensamentos? É melhor usar a correção ou não?

E um exemplo do mundo real que produziria resultados diferentes no nível de confiança de 95%. Observe que este foi um problema de lição de casa, mas nossa turma não lida com a correção de continuidade de Yates, portanto fique tranquilo sabendo que você não está fazendo minha lição de casa por mim.

samp <- matrix(c(13, 12, 15, 3), byrow = TRUE, ncol = 2)
colnames(samp) <- c("No", "Yes")
rownames(samp) <- c("Female", "Male")

chisq.test(samp, correct = TRUE)
chisq.test(samp, correct = FALSE)    
correr atrás
fonte

Respostas:

6

A correção de Yates resulta em testes mais conservadores, como nos testes "exatos" de Fisher.

Aqui está um tutorial on-line sobre o uso da correção de continuidade de Yates , de Stefanescu et al., Que aponta claramente para várias falhas de correção sistemática de continuidade (p. 4-6). Citando Agresti ( CDA 2002), "Yates (1934) mencionou que Fisher lhe sugeriu a hipergeometria para um teste exato", o que levou à versão do com correção da continuidade . Agresti também indicou que o teste de Fisher é uma boa alternativa agora que os computadores podem fazer isso mesmo para amostras grandes (p. 103). Agora, o ponto é que a escolha de um teste realmente depende da pergunta que é feita e das suposições feitas por cada um deles (por exemplo, no caso do teste de Fisher, assumimos que as margens são fixas).χ2

No seu caso, o teste de Fisher e o corrigido concordam e produzem um valor acima de 5%. No caso do ordinário , se os valores- forem calculados usando uma abordagem de Monte Carlo (ver ), ele também não alcançará significância. p χ 2 pχ2pχ2psimulate.p.value

Outras referências úteis que lidam com questões de tamanho pequeno de amostra e o uso excessivo do teste de Fisher incluem:

chl
fonte
Obrigado pelas referências. Eu era capaz de encontrar um "pré-impressão" versão do papel Campbell aqui para aqueles que não podem acessar Pub Med.
Chase
3

Se você tiver contagens baixas o suficiente para que a correção de Yates seja uma preocupação (como no seu exemplo), provavelmente você deve estar usando o teste exato de Fisher. Caso contrário, eu recomendo que, depois de usar o teste do qui-quadrado em uma tabela 2x2, confirme seu teste com um teste z de razão de chances de log.

Mike Anderson
fonte
Por que verificar um teste de razão de chances z- teste? Esse é um teste de Wald, e os testes de Wald geralmente apresentam desempenho pior do que os de pontuação, como o teste qui-quadrado de Pearson. Isso é conhecido por ser uma exceção?
onestop
Obrigado pela informação! O teste de Fisher parece ser um método mais robusto para perguntas como essas. Eu não acho que o curso que estou tomando atualmente abordará o teste de Fisher, mas definitivamente o lembrarei de aplicativos do mundo real.
Perseguição