Estou confuso sobre a suposição de normalidade em medidas repetidas ANOVA. Especificamente, estou me perguntando que tipo de normalidade exatamente deve ser satisfeita. Ao ler a literatura e as respostas no currículo, encontrei três formulações distintas dessa suposição.
A variável dependente dentro de cada condição (repetida) deve ser distribuída normalmente.
Afirma-se frequentemente que o rANOVA possui as mesmas suposições que a ANOVA, mais a esfericidade. Essa é a alegação de de Campo estatísticas Descoberta , bem como na da Wikipedia artigo sobre o assunto e texto de Lowry .
Os resíduos (diferenças entre todos os pares possíveis?) Devem ser distribuídos normalmente.
Eu encontrei essa afirmação em várias respostas no CV ( 1 , 2 ). Por analogia do rANOVA ao teste t emparelhado , isso também pode parecer intuitivo.
A normalidade multivariada deve ser satisfeita.
A Wikipedia e essa fonte mencionam isso. Além disso, eu sei que o rANOVA pode ser trocado por MANOVA, o que pode merecer essa afirmação.
São equivalentes de alguma forma? Eu sei que normalidade multivariada significa que qualquer combinação linear dos DVs é normalmente distribuída; portanto, 3. incluiria naturalmente 2. se eu entendi o último corretamente.
Se estes não são os mesmos, qual é a suposição "verdadeira" do rANOVA? Você pode fornecer uma referência?
Parece-me que há mais suporte para a primeira reivindicação. Isso não está alinhado, no entanto, com as respostas geralmente fornecidas aqui.
Modelos mistos lineares
Devido à dica de @ utobi, agora entendo como o rANOVA pode ser reapresentado como um modelo misto linear. Especificamente, para modelar como alterações na pressão arterial com o tempo, eu modelar o valor esperado como: onde y i j são medições de pressão sanguínea, um i o sangue médio pressão do i sujeito -ésima, e t i j como o j tempo -ésimo o i sujeito -ésimo foi medido, b i
Finalmente, tentei pensar no que isso significa para a normalidade, mas com pouco sucesso. Parafraseando McCulloch e Searle (2001, p. 35. Eq. (2.14)):
Eu entendo que isso significa que
4. os dados de cada indivíduo precisam ser normalmente distribuídos, mas isso não é razoável para testar com poucos pontos no tempo.
Entendo a terceira expressão para dizer que
5. as médias de assuntos individuais são normalmente distribuídas. Observe que essas são outras duas possibilidades distintas além das três mencionadas acima.
McCulloch, CE e Searle, SR (2001). Modelos generalizados, lineares e mistos . Nova York: John Wiley & Sons, Inc.
Respostas:
Este é o modelo ANOVA de medidas repetidas mais simples se o tratarmos como um modelo univariado:
Não precisamos fazer suposições distributivas sobre , pois elas podem entrar no modelo como efeitos fixos, variáveis simuladas (ao contrário do que fazemos com modelos lineares mistos). O mesmo acontece com os bonecos do tempo. Para esse modelo, você simplesmente regride o resultado de forma longa em relação aos manequins da pessoa e aos manequins de tempo. O efeito do interesse são os manequins do tempo, o teste F que testa a hipótese nula de que b 1 = . . . = b t = 0 é o principal teste na ANOVA de medidas repetidas univariada.ai F b1=...=bt=0
Quais são as premissas necessárias para o teste se comportar adequadamente? O relevante para sua pergunta é:F
Se você deseja tratar as medidas repetidas ANOVA como um modelo multivariado, as suposições de normalidade podem ser diferentes e não posso expandi-las além do que você e eu vimos na Wikipedia.
fonte
A explicação da normalidade da ANOVA de medidas repetidas pode ser encontrada aqui:
Entendendo as premissas ANOVA de medidas repetidas para interpretação correta da saída do SPSS
Você precisa da normalidade das variáveis dependentes nos resíduos (isso implica uma distribuição normal em todos os grupos, com variação comum e média dependente do grupo), como na regressão.3 → 1 ) No entanto, não estou convencido de que isso implique normalidade de resíduos (3 → 2 ), dados os resíduos são determinados por variáveis independentes (grupos, na ANOVA) também. Eu concordo com você para o ponto5 : você está basicamente falando sobre um efeito aleatório em nível individual com uma distribuição normal.
Como você notou, a normalidade multivariada implica que todas as combinações lineares das variáveis dependentes são normalmente distribuídas, portanto é um conceito mais forte do que a normalidade de variáveis únicas (
fonte