Por que ANOVA de medidas repetidas assume esfericidade?

Por esfericidade, quero dizer a suposição de que a variação de todas as diferenças entre pares entre os grupos deve ser a mesma.

Em particular, não entendo por que essa deveria ser a suposição e não que as variações das pontuações observadas no grupo sejam as mesmas.

anova repeated-measures assumptions sphericity user1205901 - Restabelecer Monica
fonte

Como comentei aqui , porque as variáveis de diferença entre os níveis de RM estão ligadas, por sua origem, a esfericidade implica que elas tenham as mesmas variações.

Ttnphns

Antes de responder, seria útil saber se você entende por que as medidas independentes ANOVA têm uma premissa de homogeneidade de variação.

John

@ John Meu entendimento é que a resposta dada em stats.stackexchange.com/questions/81914/… responde corretamente a essa pergunta.

user1205901 - Restabelece Monica

@ttnphns Infelizmente não entendi bem a sua resposta. Você ou algum outro pôster estaria interessado em transformá-lo em uma resposta mais detalhada?

user1205901 - Restabelece Monica

Respostas:

Intuição por trás da suposição de esfericidade

Uma das premissas de medidas comuns e não repetidas, a ANOVA é a mesma variância em todos os grupos.

(Podemos entender isso porque a variância igual, também conhecida como homoscedasticidade , é necessária para que o estimador OLS em regressão linear seja AZUL e para que os testes t correspondentes sejam válidos, consulte o teorema de Gauss-Markov . E a ANOVA pode ser implementada como linear. regressão.)

Então, vamos tentar reduzir o caso RM-ANOVA para o caso não RM. Por uma questão de simplicidade, tratarei da ANOVA RM de um fator (sem efeitos entre sujeitos) que possui sujeitos registrados em condições de RM. $n$ $k$

Cada sujeito pode ter seu próprio deslocamento ou interceptação específico. Se subtrairmos valores em um grupo dos valores em todos os outros grupos, cancelaremos essas interceptações e chegaremos à situação em que podemos usar ANOVA não RM para testar se essas diferenças de grupo são zero. Para que este teste seja válido, precisamos de uma suposição de variâncias iguais dessas diferenças de . $k-1$ $k-1$

Agora podemos subtrair o grupo 2 de todos os outros grupos, chegando novamente às diferenças que também devem ter variações iguais. Para cada grupo fora de , as variações das correspondentes diferenças devem ser iguais. Conclui-se rapidamente que todas as diferenças possíveis de devem ser iguais. $k-1$ $k$ $k-1$ $k(k-1)/2$

Qual é precisamente a suposição de esfericidade.

Por que as variações de grupo não deveriam ser iguais?

Quando pensamos em RM-ANOVA, geralmente pensamos em um modelo aditivo simples no estilo de modelo misto da forma onde são efeitos sujeitos, são efeitos de condição e .

y_{Eu j} = μ + α_{Eu} + β_{j} + ϵ_{Eu j},

$y_{ij}=\mu+\alpha_i + \beta_j + \epsilon_{ij},$

α_{i}

$\alpha_i$

β_{j}

$\beta_j$

ϵ \sim N (0, σ^{2})

$\epsilon\sim\mathcal N(0,\sigma^2)$

Para este modelo, as diferenças de grupo seguirão , ou seja, todas terão a mesma variância , portanto a esfericidade é válida. Mas cada grupo seguirá uma mistura de Gaussianos com médias em variações , que é uma distribuição complicada com a variação que é constante entre os grupos. $\mathcal N(\beta_{j_1} - \beta_{j_2}, 2\sigma^2)$ $2\sigma^2$ $n$ $\alpha_i$ $\sigma^2$ $V(\vec \alpha, \sigma^2)$

Portanto, neste modelo, de fato, as variações de grupo também são as mesmas. As covariâncias de grupo também são as mesmas, o que significa que este modelo implica simetria composta . Esta é uma condição mais rigorosa em comparação com a esfericidade. Como mostra meu argumento intuitivo acima, o RM-ANOVA pode funcionar bem na situação mais geral, quando o modelo aditivo escrito acima não se mantém .

Declaração matemática precisa

Vou adicionar aqui algo das condições de Huynh & Feldt, 1970, sob as quais as razões quadradas médias em desenhos de medidas repetidas têm distribuições exatas $F$ .

O que acontece quando a esfericidade quebra?

Quando a esfericidade não se mantém, provavelmente podemos esperar que a RM-ANOVA (i) tenha tamanho inflado (mais erros do tipo I), (ii) tenha potência reduzida (mais erros do tipo II). Pode-se explorar isso por simulações, mas não vou fazer isso aqui.

ameba
fonte

Acontece que o efeito de violar a esfericidade é uma perda de potência (ou seja, uma maior probabilidade de um erro do Tipo II) e uma estatística de teste (razão F) que simplesmente não pode ser comparada aos valores tabulados da distribuição F. O teste F se torna muito liberal (ou seja, a proporção de rejeições da hipótese nula é maior que o nível alfa quando a hipótese nula é verdadeira.

A investigação precisa desse assunto está muito envolvida, mas felizmente Box et al escreveram um artigo sobre isso: https://projecteuclid.org/download/pdf_1/euclid.aoms/1177728786

$\upsilon_{1}=A-1$ $\upsilon_{2}=(A-1)(S-1)$

$\upsilon_{1}$ $\epsilon$

{você}_{1 1} = ϵ (UMA - 1 1)

$\upsilon_{1} = \epsilon(A-1)$

{você}_{2} = ϵ (UMA - 1 1) (S - 1 1)

$\upsilon_{2} = \epsilon(A-1)(S-1)$

$\xi_{a,a}$

ϵ = \frac{{(\sum_{uma}^{} ξ_{uma, uma})}^{2}}{(UMA - 1 1) \sum_{uma, {uma}^{'}}^{} ξ_{uma, {uma}^{'}}^{2}}

$\epsilon = \frac{\left ( \sum_{a}^{ }\xi_{a,a} \right )^{2}}{\left ( A-1 \right )\sum_{a,a'}^{ }\xi_{a,a'}^{2}}$

O índice Box de esfericidade é melhor compreendido em relação aos valores próprios de uma matriz de covariância. Lembre-se de que as matrizes de covariância pertencem à classe de matrizes semi-definidas positivas e, portanto, sempre têm valores autovalores nulos positivos. Assim, a condição de esfericidade é equivalente a ter todos os autovalores iguais a uma constante.

Portanto, quando a esfericidade é violada, devemos aplicar algumas correções às nossas estatísticas F, e os exemplos mais notáveis dessas correções são Greenhouse-Geisser e Huynh-Feldt, por exemplo

Sem nenhuma correção, seus resultados serão tendenciosos e, portanto, não confiáveis. Espero que isto ajude!

Vasto acadêmico
fonte

+1. Vou comentar mais tarde, mas, por enquanto, o seu primeiro parágrafo combina a potência e o tamanho do teste. O que é prejudicado quando a esfericidade é violada? A taxa de erro do tipo I sob o valor nulo? Ou o poder? Ou ambos? Você provavelmente quer dizer os dois, mas a formulação não é muito clara (eu acho). Além disso, não é "Box et al", é Box sozinho :)

ameba

Eu acho que o poder será prejudicado principalmente, porque, como Box mostrou, quando a esfericidade é violada, temos que confiar em estatísticas completamente diferentes (com outros graus de liberdade). Se não confiarmos nisso, dependendo da força da nossa violação, teremos uma proporção maior de rejeições da hipótese nula.

Vast Academician

Desculpe, ainda confuso, agora pelo seu comentário: "maior proporção de rejeições do nulo" - você quer dizer quando o nulo é realmente verdadeiro? Mas isso não tem nada a ver com energia, é a taxa de erro do tipo I.

Ameba

+10. Dou minha recompensa a esta resposta: é boa e também é a única resposta que apareceu no período de recompensa. Ainda não estou totalmente satisfeito com sua resposta e comecei a escrever minha própria resposta (atualmente incompleta, mas já publicada), mas tenho apenas um entendimento parcial da matemática subjacente. Sua resposta definitivamente ajudou e a referência à Caixa 1954 também é muito útil.

Ameba

ϵ

$\epsilon$

ϵ

$\epsilon$

ξ

$\xi$

A \times A

$A\times A$

$y_{ijk}$ $i=1, ..., I; j = 1, ..., J; k = 1, ..., K.$

A média amostral do i-ésimo grupo é

{\bar{y}}_{i . .} = \frac{1}{J K} \sum_{j = 1}^{J} \sum_{k = 1}^{K} y_{i j k}

$\bar{y}_{i..} = \frac{1}{JK}\sum_{j=1}^{J}\sum_{k=1}^{K}{y_{ijk}}$

e o do i-ésimo sujeito é

{\bar{y}}_{i j .} = \frac{1}{K} \sum_{k = 1}^{K} y_{i j k}

$\bar{y}_{ij.} = \frac{1}{K}\sum_{k=1}^{K}{y_{ijk}}$

Ao assumir a independência entre os sujeitos, a variação da diferença entre duas médias de grupos é

V uma r ({\bar{y}}_{Eu . .} - {\bar{y}}_{{Eu}^{'} . .}) = \frac{1 1}{J^{2}} \sum_{j = 1 1}^{J} V uma r ({\bar{y}}_{Eu j .}) + \frac{1 1}{J^{2}} \sum_{j^{'} = 1 1}^{J} V uma r ({\bar{y}}_{{Eu}^{'} j^{'} .})

$Var(\bar{y}_{i..} - \bar{y}_{i'..}) = \frac{1}{J^2}\sum_{j=1}^JVar(\bar{y}_{ij.}) + \frac{1}{J^2}\sum_{j'=1}^JVar(\bar{y}_{i'j'.})$

$Var(\bar{y}_{ij.})$ $\sigma^{2}/K$ $\sigma^{2}$ $Var(\bar{y}_{ij.})$

Agora, para a questão da esfericidade que foi levantada.

$\bar{y}_{..k} - \bar{y}_{..k'}$

{\bar{y}}_{. . k} = \frac{1 1}{Eu J} \sum_{Eu = 1 1}^{Eu} \sum_{j = 1 1}^{J} y_{Eu j k} .

$\bar{y}_{..k} = \frac{1}{IJ}\sum_{i=1}^{I}\sum_{j=1}^{J}{y_{ijk}}.$

y_{i j k}

$y_{ijk}$

y_{i j k^{'}}

$y_{ijk'}$

V uma r ({\bar{y}}_{. . k} - {\bar{y}}_{. . k^{'}}) = \frac{1 1}{(Eu J)^{2}} \sum_{Eu = 1 1}^{Eu} \sum_{j = 1 1}^{J} V uma r (y_{Eu j k} - y_{Eu j k^{'}})

$Var(\bar{y}_{..k} - \bar{y}_{..k'}) = \frac{1}{(IJ)^2}\sum_{i=1}^I\sum_{j=1}^JVar(y_{ijk} - y_{ijk'})$

Portanto, assumindo uma variação constante de todas as diferenças aos pares, é válido realizar um teste t assim que a variação comum for estimada. Essa suposição, juntamente com a variação constante de cada observação, implica que a covariância entre qualquer par de medidas é constante em todos os pares - Sergiotem um ótimo post sobre esse tópico. As suposições, portanto, renderizam uma estrutura de variância-covariância para medições repetidas de cada sujeito como uma matriz com uma constante na diagonal e outra constante fora da diagonal. Quando as entradas fora da diagonal são zero, reduz-se ao modelo totalmente independente (o que pode ser inadequado para muitos estudos de medição repetidos). Quando as entradas fora da diagonal são as mesmas que as diagonais, as medidas repetidas são perfeitamente correlacionadas para um assunto, o que significa que qualquer medida única é tão boa quanto todas as medidas para cada sujeito. Nota final - quando K = 2 em nosso projeto simples de plotagem dividida, a condição de esfericidade é automaticamente preenchida.

T Lin
fonte