Wikipedia diz
Métodos que se baseiam em um teste abrangente antes de proceder a múltiplas comparações . Normalmente, esses métodos requerem um teste de intervalo ANOVA / Tukey significativo antes de prosseguir para múltiplas comparações. Esses métodos têm controle "fraco" do erro do tipo I.
O teste F na ANOVA é um exemplo de teste omnibus, que testa a significância geral do modelo. O teste F significativo significa que, entre as médias testadas, pelo menos duas das médias são significativamente diferentes, mas esse resultado não especifica exatamente quais são as médias diferentes umas das outras. Na verdade, as diferenças dos meios de teste foram feitas pela estatística racional quadrática F (F = MSB / MSW). Para determinar qual média difere de outra média ou qual contraste de médias é significativamente diferente, os testes Post Hoc (testes de comparação múltipla) ou planejados devem ser realizados após a obtenção de um teste F omnibus significativo. Pode-se considerar o uso da correção simples de Bonferroni ou outra correção adequada.
Portanto, um teste abrangente é usado para testar a significância geral, enquanto a comparação múltipla é descobrir quais diferenças são significativas.
Mas se eu entendi corretamente, o principal objetivo da comparação múltipla é testar a significância geral e também descobrir quais diferenças são significativas. Em outras palavras, a comparação múltipla pode fazer o que um onibus pode fazer. Então, por que precisamos de um teste de ônibus?
Um teste omnibus geralmente é um nome para testar a hipótese nula global. Um requisito mínimo para um procedimento de teste múltiplo é o controle de erros sob o nulo global. Isso é conhecido como controle "FWER fraco". Mas você provavelmente não irá parar por aí - para fins de inferência em hipóteses particulares, você desejará um procedimento que ofereça controle FWER sob qualquer combinação de nulos verdadeiros. Isso é conhecido como controle "FWER forte".
fonte
Além dos cálculos associados aos testes Pair-Wise, há outra coisa por que ANOVA é usado em vez de fazer todos os testes PAIR-WISE.
Às vezes, é possível que, embora a ANOVA rejeite a hipótese nula de que todas as médias da população sejam iguais em algum nível de confiança, mesmo assim, se você fizer todos os testes em pares (digamos LSD), poderá não encontrar pelo menos um par de meios que excede a diferença nesse nível de confiança.
Prova matemática para a afirmação acima, considerando os testes pares de LSD da FISHER
aqui:Sp
Portanto, mesmo que todos os testes de LSD em pares não possam rejeitar as hipóteses nulas, ainda há uma boa chance de que a ANOVA possa rejeitar as hipóteses nulas.
Portanto, a ANOVA contém mais informações do que em todos os testes pareados considerados juntos.
PS: Desculpas por usar a imagem em vez de digitar as equações.
fonte