Suponha que eu tenha três populações com quatro características mutuamente exclusivas. Coleto amostras aleatórias de cada população e construo uma tabela de referência cruzada ou de frequência para as características que estou medindo. Estou correto ao dizer que:
Se eu quisesse testar se existe alguma relação entre as populações e as características (por exemplo, se uma população tem uma frequência mais alta de uma das características), eu deveria executar um teste qui-quadrado e ver se o resultado é significativo.
Se o teste do qui-quadrado é significativo, isso apenas me mostra que há alguma relação entre as populações e as características, mas não como elas estão relacionadas.
Além disso, nem todas as características precisam estar relacionadas à população. Por exemplo, se as diferentes populações têm distribuições significativamente diferentes das características A e B, mas não de C e D, o teste do qui-quadrado ainda pode voltar como significativo.
Se eu quisesse medir se ou não uma característica específica é afetada pela população, então eu posso executar um teste de proporções iguais (Eu já vi esse chamado de Z-teste, ou como
prop.test()
emR
) em apenas essa característica.
Em outras palavras, é apropriado usar o prop.test()
para determinar com mais precisão a natureza de um relacionamento entre dois conjuntos de categorias quando o teste do qui-quadrado indica que existe um relacionamento significativo?
Respostas:
Resposta muito curta:
O teste do qui-quadrado (
chisq.test()
em R) compara as frequências observadas em cada categoria de uma tabela de contingência com as frequências esperadas (calculadas como o produto das frequências marginais). É usado para determinar se os desvios entre a contagem observada e a esperada são muito grandes para serem atribuídos ao acaso. A saída da independência é facilmente verificada pela inspeção de resíduos (tente?mosaicplot
ou?assocplot
, mas também veja avcd
embalagem). Usefisher.test()
para um teste exato (confiando na distribuição hipergeométrica).prop.test()
Para análise de dados discretos com R, recomendo o Manual R (e S-PLUS) para acompanhar a análise de dados categóricos da Agresti (2002) , de Laura Thompson.
fonte
prop.test
echisq.test
ambos usam o qui-quadrado, o que explicaria os valores p idênticos, bem como por que, neste post no R-Bloggers, eles têm sua própria função ad hoc.O teste mais poderoso para a igualdade de proporções é chamado teste de superioridade de Barnard .
fonte
prop.test
echisq.test
ambos usam o qui-quadrado, o que explicaria os valores de p idênticos, bem como por que neste post no R-Bloggers eles têm sua própria função ad hoc.prop.test()
... é referido como um teste z em oposição achisq.test()
. Mais tarde, Keith diz: "Um teste qui-quadrado para igualdade de duas proporções é exatamente a mesma coisa que um teste z (é por isso que @chl obtém exatamente o mesmo valor p com ambos os testes.)"prop.test()
realmente chamachisq.test()
e imprime a saída de maneira diferente.