Qual é a relação entre um teste do qui quadrado e teste de proporções iguais?

Suponha que eu tenha três populações com quatro características mutuamente exclusivas. Coleto amostras aleatórias de cada população e construo uma tabela de referência cruzada ou de frequência para as características que estou medindo. Estou correto ao dizer que:

Se eu quisesse testar se existe alguma relação entre as populações e as características (por exemplo, se uma população tem uma frequência mais alta de uma das características), eu deveria executar um teste qui-quadrado e ver se o resultado é significativo.
Se o teste do qui-quadrado é significativo, isso apenas me mostra que há alguma relação entre as populações e as características, mas não como elas estão relacionadas.
Além disso, nem todas as características precisam estar relacionadas à população. Por exemplo, se as diferentes populações têm distribuições significativamente diferentes das características A e B, mas não de C e D, o teste do qui-quadrado ainda pode voltar como significativo.
Se eu quisesse medir se ou não uma característica específica é afetada pela população, então eu posso executar um teste de proporções iguais (Eu já vi esse chamado de Z-teste, ou como prop.test()em R) em apenas essa característica.

Em outras palavras, é apropriado usar o prop.test()para determinar com mais precisão a natureza de um relacionamento entre dois conjuntos de categorias quando o teste do qui-quadrado indica que existe um relacionamento significativo?

chi-squared proportion contingency-tables z-test hgcrpd
fonte

Leia também: stats.stackexchange.com/q/173415/3277 .

ttnphns

Respostas:

Resposta muito curta:

O teste do qui-quadrado ( chisq.test()em R) compara as frequências observadas em cada categoria de uma tabela de contingência com as frequências esperadas (calculadas como o produto das frequências marginais). É usado para determinar se os desvios entre a contagem observada e a esperada são muito grandes para serem atribuídos ao acaso. A saída da independência é facilmente verificada pela inspeção de resíduos (tente ?mosaicplotou ?assocplot, mas também veja a vcdembalagem). Use fisher.test()para um teste exato (confiando na distribuição hipergeométrica).

prop.test() $z$

z = \frac{(f_{1} - f_{2})}{\sqrt{\hat{p} (1 - \hat{p}) (\frac{1}{n_{1}} + \frac{1}{n_{2}})}}

$z=\frac{(f_1-f_2)}{\sqrt{\hat p \left(1-\hat p \right) \left(\frac{1}{n_1}+\frac{1}{n_2}\right)}}$

$\hat p=(p_1+p_2)/(n_1+n_2)$ $(1,2)$ $H_0:\; p_1=p_2$ $\chi^2$

> tab <- matrix(c(100, 80, 20, 10), ncol = 2)
> chisq.test(tab)

    Pearson's Chi-squared test with Yates' continuity correction

data:  tab 
X-squared = 0.8823, df = 1, p-value = 0.3476

> prop.test(tab)

    2-sample test for equality of proportions with continuity correction

data:  tab 
X-squared = 0.8823, df = 1, p-value = 0.3476
alternative hypothesis: two.sided 
95 percent confidence interval:
 -0.15834617  0.04723506 
sample estimates:
   prop 1    prop 2 
0.8333333 0.8888889

Para análise de dados discretos com R, recomendo o Manual R (e S-PLUS) para acompanhar a análise de dados categóricos da Agresti (2002) , de Laura Thompson.

chl
fonte

Existe um nome comum para o teste que prop.test () executa?

precisa saber é o seguinte

"É referido como um teste z".

russellpierce

@chl Estou um pouco confuso - pensei prop.teste chisq.testambos usam o qui-quadrado, o que explicaria os valores p idênticos, bem como por que, neste post no R-Bloggers, eles têm sua própria função ad hoc.

Antoni Parellada

@ Antoni Sim, é isso que Keith explicou em sua resposta.

chl

n_{1}

$n_1$

n_{2}

$n_2$

f_{1}

$f_1$

f_{2}

$f_2$

p_{1}

$p_1$

p_{2}

$p_2$

$z$ $p$

$\alpha$

O teste mais poderoso para a igualdade de proporções é chamado teste de superioridade de Barnard .

Keith Winstein
fonte

@gung Estou um pouco confuso - pensei prop.teste chisq.testambos usam o qui-quadrado, o que explicaria os valores de p idênticos, bem como por que neste post no R-Bloggers eles têm sua própria função ad hoc.

Antoni Parellada

Eu não entendo o que está confundindo você, @AntoniParellada. Essa resposta afirma que eles são "exatamente iguais", o que faz sentido se os "ambos usam o qui-quadrado".

gung - Restabelece Monica

@gung na resposta original chl afirma que prop.test()... é referido como um teste z em oposição a chisq.test(). Mais tarde, Keith diz: "Um teste qui-quadrado para igualdade de duas proporções é exatamente a mesma coisa que um teste z (é por isso que @chl obtém exatamente o mesmo valor p com ambos os testes.)"

Antoni Parellada

Isso parece ser apenas uma frase infelícita, @AntoniParellada. Conceitualmente, os dois testes são distintos, e foi o que discuti na minha outra resposta que você viu. Mas matematicamente, eles são equivalentes. De fato, acredito que a função R prop.test()realmente chama chisq.test()e imprime a saída de maneira diferente.

gung - Restabelece Monica

@gung Eu estava trabalhando em uma função semelhante ao R-Bloggers e ia fazer um post para pessoas do meu nível de iniciante, citando você de fato sobre alguns conceitos-chave que você escreveu, analisando a matemática tanto para o chi quadrado e teste z e, em seguida, fornecendo o código R.

Antoni Parellada