É errado usar ANOVA em vez de um teste t para comparar duas médias?

11

Tenho uma distribuição de salários e quero comparar a diferença de médias entre homens e mulheres. Eu sei que há o teste T do aluno para comparar duas médias, mas depois de sugerir a ANOVA, recebi algumas críticas dizendo que a ANOVA é para comparar mais de duas médias.

O que (se houver) está errado em usá-lo para comparar apenas dois meios?

Pablo Fernandez
fonte
9
Quem disse que está errado?
gung - Restabelece Monica
1
Por que você não reformula a pergunta suprimindo quaisquer suposições? Algo parecido com "ANOVA é equivalente a um teste t ao comparar dois grupos?" Apenas uma idéia ... Eu vou tomar nenhuma responsabilidade por como acolher a questão é de qualquer maneira :-)
Antoni Parellada
4
Como alternativa, modifique sua pergunta para mostrar a alguém que está errado ... para que possamos explicar que eles estão enganados. A dificuldade aqui é que a premissa da pergunta (que está errada) está errada.
Glen_b -Reinstala Monica 26/09
1
Embora a premissa esteja equivocada, essa pergunta não parece estar fora do tópico ou, portanto, não está clara, não pode ser respondida (de fato, foi respondida). Eu acho que isso pode ficar aberto.
gung - Restabelece Monica
1
Concordo, @ gung. Eu acho que a pergunta reflete uma falta de conhecimento sobre o tópico. Se fosse redigido de forma diferente (ou "melhor"), a pergunta provavelmente não teria sido feita, porque eles já sabiam a resposta.
D_Williams 26/09/16

Respostas:

20

Não está errado e será equivalente ao teste que assume variações iguais. Além disso, com dois grupos, sqrt (estatística f) é igual ao (valor absoluto da) estatística t. Estou um pouco confiante de que um teste t com variações desiguais não é equivalente. Como você pode obter estimativas apropriadas quando as variações são desiguais (as variações geralmente são sempre desiguais em algumas casas decimais), provavelmente faz sentido usar o teste t, pois é mais flexível que uma ANOVA (supondo que você tenha apenas dois grupos).

Atualizar:

Aqui está o código para mostrar que a estatística t ^ 2 para o teste t de variância igual, mas não o teste t desigual, é a mesma que a estatística f.

dat_mtcars <- mtcars

# unequal variance model
 t_unequal <- t.test(mpg ~ factor(vs), data = dat_mtcars)
 t_stat_unequal <-  t_unequal$statistic

# assume equal variance
 t_equal <- t.test(mpg ~ factor(vs), var.equal = TRUE, data = dat_mtcars)
 t_stat_equal <- t_equal$statistic

# anova
 a_equal <- aov(mpg ~ factor(vs), data = dat_mtcars)
 f_stat <- anova(a_equal)
 f_stat$`F value`[1]

# compare by dividing (1 = equivalence)
 (t_stat_unequal^2) / f_stat$`F value`[1] 
 (t_stat_equal^2) / f_stat$`F value`[1] # (t-stat with equal var^2) = F
D_Williams
fonte
3
+1, observe que é possível ajustar um teste ANOVA / F unidirecional para variações desiguais (cf. Alternativas à ANOVA unidirecional para dados heterocedásticos ).
gung - Restabelece Monica
@gung OK. Eu não tinha certeza disso, pois não utilizava a ANOVA há algum tempo (venho fazendo a coisa bayesiana).
D_Williams
tt
4

Eles são equivalentes. Uma ANOVA com apenas dois grupos é equivalente a um teste t. A diferença é que, quando você tem vários grupos, o erro do tipo I aumentará para os testes t, pois você não poderá testar a hipótese em conjunto. A ANOVA não sofre desse problema, pois você as testa em conjunto por meio de um teste F.

robinsa
fonte
1
Não acho que ele perca poder, acho que tem mais a ver com os erros do tipo I. Em geral, quanto mais testes você tiver, maior poder deverá obter.
HelloWorld
Acredito que (como o @TudentT diz) é uma questão de erros do tipo I. Em um curso que estou tomando, eles estão nos fazendo usar a "Correção de Bonferroni" exatamente para isso. pt.wikipedia.org/wiki/Bonferroni_correction
Pablo Fernandez
Sim, você está correto. Não deve ser de energia (tipo II), mas de erros do tipo I. Acredito que o raciocínio esteja correto, mas, por algum motivo, escrevi power e não erro tipo 1. Vou editar para ter certeza de não enganar ninguém.
robinsa 27/09/16