Estou testando a independência em uma tabela de contingência Não sei se o teste G ou o qui-quadrado de Pearson são melhores. O tamanho da amostra está na casa das centenas, mas há algumas contagens baixas de células. Conforme declarado na página da Wikipedia , a aproximação à distribuição qui-quadrado é melhor para o teste G do que para o teste qui-quadrado de Pearson. Mas estou usando a simulação de Monte Carlo para calcular o valor p, então há alguma diferença entre esses dois testes?
10
Respostas:
Eles são assintoticamente iguais. São apenas maneiras diferentes de obter a mesma idéia. Mais especificamente, o teste qui-quadrado de Pearson é um teste de pontuação, enquanto o teste G é um teste de razão de verossimilhança. Para entender melhor essas idéias, pode ser útil ler minha resposta aqui: Por que meus valores p diferem entre a saída da regressão logística, o teste do qui-quadrado e o intervalo de confiança para a sala de cirurgia? Para responder sua pergunta direta, se você estiver computando o valor-p pela simulação de Monte Carlo, isso não deve importar; você pode usar o que for mais conveniente para você. Observe que não há problema com baixa contagem de células, apenas (potencialmente) baixa expectativacontagem de células; é possível ter contagens baixas de células e ter contagens esperadas que são boas. Além disso, nem a baixa contagem real nem a baixa contagem esperada são importantes quando o valor-p é determinado por simulação.
(Pelo que vale a pena, eu provavelmente usaria o qui-quadrado de Pearson, porque R tem uma função conveniente para aquilo que inclui a opção de simular o valor-p.)
fonte
chisq.test
,.Dê uma olhada no Rfast. https://cran.r-project.org/web/packages/Rfast/index.html Os comandos relevantes são g2Test_univariate (data, dc) g2Test_univariate_perm (dados, dc, nperm) Os cálculos são extremamente rápidos. E, em geral, prefere o teste G ^ 2, pois o qui-quadrado é uma aproximação a ele.
fonte
O teste do qui-quadrado e o teste G geralmente produzem resultados semelhantes. Mas o mais importante aqui é que você deve escolher um dos dois testes e cumpri-lo, não apenas no teste mencionado, mas também em testes futuros durante o curso de sua pesquisa. É aconselhável, porque se você tentar usar os dois testes de forma intercambiável, é muito provável que aumente a chance de obter falso positivo.
fonte