Por que ANOVA de medidas repetidas assume esfericidade?
Por esfericidade, quero dizer a suposição de que a variação de todas as diferenças entre pares entre os grupos deve ser a mesma.
Em particular, não entendo por que essa deveria ser a suposição e não que as variações das pontuações observadas no grupo sejam as mesmas.
anova
repeated-measures
assumptions
sphericity
user1205901 - Restabelecer Monica
fonte
fonte
Respostas:
Intuição por trás da suposição de esfericidade
Uma das premissas de medidas comuns e não repetidas, a ANOVA é a mesma variância em todos os grupos.
(Podemos entender isso porque a variância igual, também conhecida como homoscedasticidade , é necessária para que o estimador OLS em regressão linear seja AZUL e para que os testes t correspondentes sejam válidos, consulte o teorema de Gauss-Markov . E a ANOVA pode ser implementada como linear. regressão.)
Então, vamos tentar reduzir o caso RM-ANOVA para o caso não RM. Por uma questão de simplicidade, tratarei da ANOVA RM de um fator (sem efeitos entre sujeitos) que possui sujeitos registrados em k condições de RM.n k
Cada sujeito pode ter seu próprio deslocamento ou interceptação específico. Se subtrairmos valores em um grupo dos valores em todos os outros grupos, cancelaremos essas interceptações e chegaremos à situação em que podemos usar ANOVA não RM para testar se essas diferenças de grupo são zero. Para que este teste seja válido, precisamos de uma suposição de variâncias iguais dessas diferenças de k - 1 .k - 1 k - 1
Agora podemos subtrair o grupo 2 de todos os outros grupos, chegando novamente às diferenças que também devem ter variações iguais. Para cada grupo fora de k , as variações das correspondentes diferenças k - 1 devem ser iguais. Conclui-se rapidamente que todas as diferenças possíveis de k ( k - 1 ) / 2 devem ser iguais.k - 1 k k - 1 k ( k - 1 ) / 2
Qual é precisamente a suposição de esfericidade.
Por que as variações de grupo não deveriam ser iguais?
Quando pensamos em RM-ANOVA, geralmente pensamos em um modelo aditivo simples no estilo de modelo misto da forma onde α i são efeitos sujeitos, β j são efeitos de condição e ϵ ∼ N ( 0 , σ 2 ) .
Para este modelo, as diferenças de grupo seguirão , ou seja, todas terão a mesma variância 2 σ 2 , portanto a esfericidade é válida. Mas cada grupo seguirá uma mistura de n Gaussianos com médias em α ie variações σ 2 , que é uma distribuição complicada com a variação V ( → α , σ 2 ) que é constante entre os grupos.N( βj1 1- βj2, 2 σ2) 2 σ2 n αEu σ2 V( α⃗ , σ2)
Portanto, neste modelo, de fato, as variações de grupo também são as mesmas. As covariâncias de grupo também são as mesmas, o que significa que este modelo implica simetria composta . Esta é uma condição mais rigorosa em comparação com a esfericidade. Como mostra meu argumento intuitivo acima, o RM-ANOVA pode funcionar bem na situação mais geral, quando o modelo aditivo escrito acima não se mantém .
Declaração matemática precisa
Vou adicionar aqui algo das condições de Huynh & Feldt, 1970, sob as quais as razões quadradas médias em desenhos de medidas repetidas têm distribuições exatasF .
O que acontece quando a esfericidade quebra?
Quando a esfericidade não se mantém, provavelmente podemos esperar que a RM-ANOVA (i) tenha tamanho inflado (mais erros do tipo I), (ii) tenha potência reduzida (mais erros do tipo II). Pode-se explorar isso por simulações, mas não vou fazer isso aqui.
fonte
Acontece que o efeito de violar a esfericidade é uma perda de potência (ou seja, uma maior probabilidade de um erro do Tipo II) e uma estatística de teste (razão F) que simplesmente não pode ser comparada aos valores tabulados da distribuição F. O teste F se torna muito liberal (ou seja, a proporção de rejeições da hipótese nula é maior que o nível alfa quando a hipótese nula é verdadeira.
A investigação precisa desse assunto está muito envolvida, mas felizmente Box et al escreveram um artigo sobre isso: https://projecteuclid.org/download/pdf_1/euclid.aoms/1177728786
O índice Box de esfericidade é melhor compreendido em relação aos valores próprios de uma matriz de covariância. Lembre-se de que as matrizes de covariância pertencem à classe de matrizes semi-definidas positivas e, portanto, sempre têm valores autovalores nulos positivos. Assim, a condição de esfericidade é equivalente a ter todos os autovalores iguais a uma constante.
Portanto, quando a esfericidade é violada, devemos aplicar algumas correções às nossas estatísticas F, e os exemplos mais notáveis dessas correções são Greenhouse-Geisser e Huynh-Feldt, por exemplo
Sem nenhuma correção, seus resultados serão tendenciosos e, portanto, não confiáveis. Espero que isto ajude!
fonte
A média amostral do i-ésimo grupo é
e o do i-ésimo sujeito é
Ao assumir a independência entre os sujeitos, a variação da diferença entre duas médias de grupos é
Agora, para a questão da esfericidade que foi levantada.
Portanto, assumindo uma variação constante de todas as diferenças aos pares, é válido realizar um teste t assim que a variação comum for estimada. Essa suposição, juntamente com a variação constante de cada observação, implica que a covariância entre qualquer par de medidas é constante em todos os pares - Sergiotem um ótimo post sobre esse tópico. As suposições, portanto, renderizam uma estrutura de variância-covariância para medições repetidas de cada sujeito como uma matriz com uma constante na diagonal e outra constante fora da diagonal. Quando as entradas fora da diagonal são zero, reduz-se ao modelo totalmente independente (o que pode ser inadequado para muitos estudos de medição repetidos). Quando as entradas fora da diagonal são as mesmas que as diagonais, as medidas repetidas são perfeitamente correlacionadas para um assunto, o que significa que qualquer medida única é tão boa quanto todas as medidas para cada sujeito. Nota final - quando K = 2 em nosso projeto simples de plotagem dividida, a condição de esfericidade é automaticamente preenchida.
fonte