Tenho certeza de que tenho isso completamente enrolado na minha cabeça, mas simplesmente não consigo entender.
O teste t compara duas distribuições normais usando a distribuição Z. É por isso que existe uma suposição de normalidade nos DADOS.
ANOVA é equivalente à regressão linear com variáveis dummy e usa somas de quadrados, assim como OLS. É por isso que existe uma suposição de normalidade dos RESIDUAIS.
Levei vários anos, mas acho que finalmente entendi esses fatos básicos. Então, por que o teste t é equivalente à ANOVA em dois grupos? Como eles podem ser equivalentes se eles nem assumem as mesmas coisas sobre os dados?
distributions
regression
normality-assumption
t-test
anova
Chris Beeley
fonte
fonte
Respostas:
O teste t com dois grupos assume que cada grupo é normalmente distribuído com a mesma variância (embora as médias possam diferir sob a hipótese alternativa). Isso é equivalente a uma regressão com uma variável dummy, pois a regressão permite que a média de cada grupo seja diferente, mas não a variância. Portanto, os resíduos (iguais aos dados com as médias do grupo subtraídas) têm a mesma distribuição - ou seja, são normalmente distribuídos com média zero.
Um teste t com variações desiguais não é equivalente a uma ANOVA unidirecional.
fonte
O teste t é simplesmente um caso especial do teste F, onde apenas dois grupos estão sendo comparados. O resultado de qualquer um será exatamente o mesmo em termos de valor-p e também existe uma relação simples entre as estatísticas F e t. F = t ^ 2. Os dois testes são algebricamente equivalentes e suas suposições são as mesmas.
De fato, essas equivalências se estendem a toda a classe de ANOVAs, testes t e modelos de regressão linear. O teste t é um caso especial de ANOVA. ANOVA é um caso especial de regressão. Todos esses procedimentos são incluídos no Modelo Linear Geral e compartilham as mesmas premissas.
Você pode pensar nisso como normalidade nos dados, mas está verificando a normalidade em cada grupo - o que é realmente o mesmo que verificar a normalidade nos resíduos quando o único preditor no modelo é um indicador de grupo. Da mesma forma com variâncias iguais.
Apenas como um aparte, R não possui rotinas separadas para ANOVA. As funções anova em R são apenas wrappers para a função lm () - a mesma coisa que é usada para ajustar modelos de regressão linear - empacotadas de maneira um pouco diferente para fornecer o que normalmente é encontrado em um resumo ANOVA em vez de um resumo de regressão.
fonte
lm()
, a menos que você mude para modelos mistos com o pacotenlme
oulme4
, mas há uma maneira prática de lidar com medições repetidas através da especificação apropriada doError
termoaov()
, veja mais detalhes no tutorial de Baron e Li, §6.9, j.mp/ c5ME4uaov()
é construído sobre alm()
função, mas inclui argumentos adicionais, chamados Termos especiais , comoError
.Concordo totalmente com a resposta de Rob, mas deixe-me colocar de outra maneira (usando a wikipedia):
Premissas ANOVA :
Teste t de premissas :
Por isso, refutaria a pergunta, pois elas obviamente têm as mesmas suposições (embora em uma ordem diferente :-)).
fonte
Um ponto óbvio que todo mundo ignorou: com a ANOVA, você está testando o nulo de que a média é idêntica, independentemente dos valores de suas variáveis explicativas. Com um Teste-T, você também pode testar o caso unilateral, de que a média é especificamente maior, dado um valor da sua variável explicativa, do que o outro.
fonte
Prefiro usar o teste t para comparar dois grupos e utilizarei ANOVA para mais de 2 grupos, por motivos. Razão importante é a suposição de variâncias iguais.
fonte