Gostaria de reunir informações de pessoas no campo sobre a correção da continuidade de Yates para tabelas de contingência 2 x 2. O artigo da Wikipedia menciona que pode se ajustar muito longe e, portanto, é usado apenas em um sentido limitado. O post relacionado aqui não oferece muito mais informações.
Então, para as pessoas que usam esses testes regularmente, quais são seus pensamentos? É melhor usar a correção ou não?
E um exemplo do mundo real que produziria resultados diferentes no nível de confiança de 95%. Observe que este foi um problema de lição de casa, mas nossa turma não lida com a correção de continuidade de Yates, portanto fique tranquilo sabendo que você não está fazendo minha lição de casa por mim.
samp <- matrix(c(13, 12, 15, 3), byrow = TRUE, ncol = 2)
colnames(samp) <- c("No", "Yes")
rownames(samp) <- c("Female", "Male")
chisq.test(samp, correct = TRUE)
chisq.test(samp, correct = FALSE)
fonte
Se você tiver contagens baixas o suficiente para que a correção de Yates seja uma preocupação (como no seu exemplo), provavelmente você deve estar usando o teste exato de Fisher. Caso contrário, eu recomendo que, depois de usar o teste do qui-quadrado em uma tabela 2x2, confirme seu teste com um teste z de razão de chances de log.
fonte