Sou estudante de doutorado em psicologia experimental e tento muito melhorar minhas habilidades e conhecimentos sobre como analisar meus dados.
Até o meu quinto ano em psicologia, eu pensava que os modelos semelhantes à regressão (por exemplo, ANOVA) assumem o seguinte:
- normalidade dos dados
- homogeneidade de variação para os dados e assim por diante
Meus cursos de graduação me levaram a acreditar que as suposições eram sobre os dados. No entanto, no meu quinto ano, alguns de meus instrutores enfatizaram o fato de que as suposições são sobre o erro (estimado pelos resíduos) e não os dados brutos.
Recentemente, conversei sobre a questão das suposições com alguns de meus colegas que também admitiram ter descoberto a importância de verificar as suposições sobre o resíduo apenas nos últimos anos de universidade.
Se bem entendi, os modelos semelhantes a regressão fazem suposições sobre o erro. Portanto, faz sentido verificar as suposições sobre os resíduos. Se sim, por que algumas pessoas verificam as suposições nos dados brutos? É porque esse procedimento de verificação se aproxima do que obteríamos verificando o residual?
Eu ficaria muito interessado em uma discussão sobre esse assunto com algumas pessoas que têm um conhecimento mais preciso do que meus colegas e eu. Agradeço antecipadamente suas respostas.
fonte
Acho que a diferenciação entre os resíduos e os dados brutos não ajuda, pois ambos se referem mais à sua amostra real e não à distribuição da população subjacente. É melhor considerar alguns requisitos como "requisitos dentro do grupo" e outros "entre premissas do grupo".
Por exemplo, a homonenidade da variação é uma "suposição entre grupos", pois indica que a variação dentro do grupo é a mesma para todos os grupos.
Normalidade é uma suposição "dentro do grupo" que requer que dentro de cada grupo y seja distribuído normalmente.
Observe que ter normalidade em toda a sua produção geralmente significa que você não tem efeito - observe a distribuição de gênero sem diferenciar entre mulheres e homens. Não será normalmente distribuído, devido ao forte efeito de gênero. Mas, dentro de cada gênero, isso vale muito bem.
fonte