Teste G versus teste qui-quadrado de Pearson

10

Estou testando a independência em uma tabela de contingência Não sei se o teste G ou o qui-quadrado de Pearson são melhores. O tamanho da amostra está na casa das centenas, mas há algumas contagens baixas de células. Conforme declarado na página da Wikipedia , a aproximação à distribuição qui-quadrado é melhor para o teste G do que para o teste qui-quadrado de Pearson. Mas estou usando a simulação de Monte Carlo para calcular o valor p, então há alguma diferença entre esses dois testes?N×M

oodkan
fonte
11
Consulte Deviance x Pearson ajuste de qualidade .
Scortchi - Restabelece Monica

Respostas:

8

Eles são assintoticamente iguais. São apenas maneiras diferentes de obter a mesma idéia. Mais especificamente, o teste qui-quadrado de Pearson é um teste de pontuação, enquanto o teste G é um teste de razão de verossimilhança. Para entender melhor essas idéias, pode ser útil ler minha resposta aqui: Por que meus valores p diferem entre a saída da regressão logística, o teste do qui-quadrado e o intervalo de confiança para a sala de cirurgia? Para responder sua pergunta direta, se você estiver computando o valor-p pela simulação de Monte Carlo, isso não deve importar; você pode usar o que for mais conveniente para você. Observe que não há problema com baixa contagem de células, apenas (potencialmente) baixa expectativacontagem de células; é possível ter contagens baixas de células e ter contagens esperadas que são boas. Além disso, nem a baixa contagem real nem a baixa contagem esperada são importantes quando o valor-p é determinado por simulação.

(Pelo que vale a pena, eu provavelmente usaria o qui-quadrado de Pearson, porque R tem uma função conveniente para aquilo que inclui a opção de simular o valor-p.)

- Reinstate Monica
fonte
qual é a função em R?
Llewmills
@llewmills chisq.test,.
gung - Restabelece Monica
1

Dê uma olhada no Rfast. https://cran.r-project.org/web/packages/Rfast/index.html Os comandos relevantes são g2Test_univariate (data, dc) g2Test_univariate_perm (dados, dc, nperm) Os cálculos são extremamente rápidos. E, em geral, prefere o teste G ^ 2, pois o qui-quadrado é uma aproximação a ele.

Michail
fonte
-1

O teste do qui-quadrado e o teste G geralmente produzem resultados semelhantes. Mas o mais importante aqui é que você deve escolher um dos dois testes e cumpri-lo, não apenas no teste mencionado, mas também em testes futuros durante o curso de sua pesquisa. É aconselhável, porque se você tentar usar os dois testes de forma intercambiável, é muito provável que aumente a chance de obter falso positivo.

pequeno monstro
fonte
2
Qual é o raciocínio pelo qual a alegação de que a chance de um falso positivo é aumentada? (A menos que você pretenda sugerir que o teste seja escolhido por referência às contagens reais - mas é a referência às contagens para escolher entre elas que é o problema, em vez da ideia de potencialmente trocar testes por si só)
Glen_b -Reinstate Monica
2
@Glen_b chance de obter falsos prováveis aumentos positivos se escolher um p-valor do teste que é mais favorável para os nossos pressupostos (no caso, tente ambos os testes)
little_monster