Qual é a relação entre um teste do qui quadrado e teste de proporções iguais?

52

Suponha que eu tenha três populações com quatro características mutuamente exclusivas. Coleto amostras aleatórias de cada população e construo uma tabela de referência cruzada ou de frequência para as características que estou medindo. Estou correto ao dizer que:

  1. Se eu quisesse testar se existe alguma relação entre as populações e as características (por exemplo, se uma população tem uma frequência mais alta de uma das características), eu deveria executar um teste qui-quadrado e ver se o resultado é significativo.

  2. Se o teste do qui-quadrado é significativo, isso apenas me mostra que há alguma relação entre as populações e as características, mas não como elas estão relacionadas.

  3. Além disso, nem todas as características precisam estar relacionadas à população. Por exemplo, se as diferentes populações têm distribuições significativamente diferentes das características A e B, mas não de C e D, o teste do qui-quadrado ainda pode voltar como significativo.

  4. Se eu quisesse medir se ou não uma característica específica é afetada pela população, então eu posso executar um teste de proporções iguais (Eu já vi esse chamado de Z-teste, ou como prop.test()em R) em apenas essa característica.

Em outras palavras, é apropriado usar o prop.test()para determinar com mais precisão a natureza de um relacionamento entre dois conjuntos de categorias quando o teste do qui-quadrado indica que existe um relacionamento significativo?

hgcrpd
fonte
Leia também: stats.stackexchange.com/q/173415/3277 .
ttnphns

Respostas:

23

Resposta muito curta:

O teste do qui-quadrado ( chisq.test()em R) compara as frequências observadas em cada categoria de uma tabela de contingência com as frequências esperadas (calculadas como o produto das frequências marginais). É usado para determinar se os desvios entre a contagem observada e a esperada são muito grandes para serem atribuídos ao acaso. A saída da independência é facilmente verificada pela inspeção de resíduos (tente ?mosaicplotou ?assocplot, mas também veja a vcdembalagem). Use fisher.test()para um teste exato (confiando na distribuição hipergeométrica).

prop.test()z

z=(f1f2)p^(1p^)(1n1+1n2)

p^=(p1+p2)/(n1+n2)(1,2)H0:p1=p2χ2

> tab <- matrix(c(100, 80, 20, 10), ncol = 2)
> chisq.test(tab)

    Pearson's Chi-squared test with Yates' continuity correction

data:  tab 
X-squared = 0.8823, df = 1, p-value = 0.3476

> prop.test(tab)

    2-sample test for equality of proportions with continuity correction

data:  tab 
X-squared = 0.8823, df = 1, p-value = 0.3476
alternative hypothesis: two.sided 
95 percent confidence interval:
 -0.15834617  0.04723506 
sample estimates:
   prop 1    prop 2 
0.8333333 0.8888889 

Para análise de dados discretos com R, recomendo o Manual R (e S-PLUS) para acompanhar a análise de dados categóricos da Agresti (2002) , de Laura Thompson.

chl
fonte
2
Existe um nome comum para o teste que prop.test () executa?
precisa saber é o seguinte
2
"É referido como um teste z".
russellpierce
@chl Estou um pouco confuso - pensei prop.teste chisq.testambos usam o qui-quadrado, o que explicaria os valores p idênticos, bem como por que, neste post no R-Bloggers, eles têm sua própria função ad hoc.
Antoni Parellada
@ Antoni Sim, é isso que Keith explicou em sua resposta.
chl
3
n1n2f1f2p1p2
23

zp

α

α

O teste mais poderoso para a igualdade de proporções é chamado teste de superioridade de Barnard .

Keith Winstein
fonte
@gung Estou um pouco confuso - pensei prop.teste chisq.testambos usam o qui-quadrado, o que explicaria os valores de p idênticos, bem como por que neste post no R-Bloggers eles têm sua própria função ad hoc.
Antoni Parellada
Eu não entendo o que está confundindo você, @AntoniParellada. Essa resposta afirma que eles são "exatamente iguais", o que faz sentido se os "ambos usam o qui-quadrado".
gung - Restabelece Monica
@gung na resposta original chl afirma que prop.test()... é referido como um teste z em oposição a chisq.test(). Mais tarde, Keith diz: "Um teste qui-quadrado para igualdade de duas proporções é exatamente a mesma coisa que um teste z (é por isso que @chl obtém exatamente o mesmo valor p com ambos os testes.)"
Antoni Parellada
11
Isso parece ser apenas uma frase infelícita, @AntoniParellada. Conceitualmente, os dois testes são distintos, e foi o que discuti na minha outra resposta que você viu. Mas matematicamente, eles são equivalentes. De fato, acredito que a função R prop.test()realmente chama chisq.test()e imprime a saída de maneira diferente.
gung - Restabelece Monica
@gung Eu estava trabalhando em uma função semelhante ao R-Bloggers e ia fazer um post para pessoas do meu nível de iniciante, citando você de fato sobre alguns conceitos-chave que você escreveu, analisando a matemática tanto para o chi quadrado e teste z e, em seguida, fornecendo o código R.
Antoni Parellada