Estou analisando um conjunto de dados experimental. Os dados consistem em um vetor pareado do tipo de tratamento e um resultado binomial:
Treatment Outcome
A 1
B 0
C 0
D 1
A 0
...
Na coluna de resultados, 1 indica sucesso e 0 indica falha. Eu gostaria de descobrir se o tratamento varia significativamente o resultado. Existem 4 tratamentos diferentes com cada experimento repetido um grande número de vezes (2000 para cada tratamento).
Minha pergunta é: posso analisar o resultado binário usando ANOVA? Ou devo usar um teste do qui-quadrado para verificar os dados binomiais? Parece que o qui-quadrado assume que a proporção seria dividida igualmente, o que não é o caso. Outra idéia seria resumir os dados usando a proporção de sucessos versus fracassos de cada tratamento e, em seguida, usar um teste de proporção.
Estou curioso para ouvir suas recomendações para testes que fazem sentido para esse tipo de experimento binomial de sucesso / falha.
fonte
No entanto, alguns autores modernos são bastante céticos em relação à transformação do arco-seno, veja, por exemplo, http://www.mun.ca/biology/dschneider/b7932/B7932Final10Dec2010.pdf Mas esses autores estão preocupados com problemas como a previsão, onde mostram a O arcsine pode causar problemas. Se você está preocupado apenas com o teste de hipóteses, deve estar OK. Uma abordagem mais moderna poderia usar regressão logística.
fonte
Gostaria de diferir do que você pensa sobre o teste Chi-Sq. É aplicável mesmo se os dados não forem binomiais. É baseado na normalidade assintótica de mle (na maioria dos casos).
Eu faria uma regressão logística como esta:
Onde
É o equivalente ANOVA se existe uma relação ou não.
O teste é que A tem algum efeito.
É o teste é B tem algum efeito.
É o teste é C tem algum efeito.
Agora você pode fazer mais contrastes para encontrar o que você está interessado. Ainda é um teste qui-quadrado, mas com diferentes graus de liberdade (3, 1, 1 e 1, respectivamente)
fonte
Eu acho que você está certo que a ANOVA não deve ser usada para analisar variáveis dependentes binomiais. Muitas pessoas usam isso para comparar médias da variável de resposta binária (0 1), mas ela não deve ser usada porque isso viola seriamente a suposição de normalidade e igual. Testes de qui-quadrado ou regressão logística são os melhores para essas situações.
fonte