Como fazer ANOVA em dados que ainda não são normais após transformações?

8

Estou observando o efeito que as condições indutoras de derrota e aprisionamento têm nas classificações subjetivas de derrota e aprisionamento em três momentos diferentes (entre outras coisas).

No entanto, as classificações subjetivas não são normalmente distribuídas. Fiz várias transformações e a transformação squareroot parece funcionar melhor. No entanto, ainda existem alguns aspectos dos dados que não foram normalizados. Essa não normalidade se manifesta na assimetria negativa nas condições de alta derrota e alto aprisionamento no momento em que eu esperava que houvesse as maiores classificações de derrota e aprisionamento. Consequentemente, acho que se poderia argumentar que esse desvio se deve à manipulação experimental.

Seria aceitável executar ANOVAs nesses dados, apesar da falta de normalidade, dadas as manipulações? Ou testes não paramétricos seriam mais apropriados? Em caso afirmativo, existe um equivalente não paramétrico de uma ANOVA mista 4x3?

mpiktas
fonte

Respostas:

15

São os resíduos que devem ser normalmente distribuídos, não a distribuição marginal da sua variável de resposta.

Eu tentaria usar transformações, fazer a ANOVA e verificar os resíduos. Se eles parecerem notavelmente não normais, independentemente da transformação que você usa, eu mudaria para um teste não paramétrico, como o teste de Friedman.

Rob Hyndman
fonte
1
+1. Digno de nota é que existem procedimentos formais bastante simples para investigar transformações, como gráficos de expansão versus nível (descritos na EDA de Tukey ).
whuber
3

Acredito que, com dados inclinados negativamente, talvez você precise refletir os dados para se tornar inclinado positivamente antes de aplicar outra transformação de dados (por exemplo, log ou raiz quadrada). No entanto, isso tende a dificultar a interpretação dos seus resultados.

Qual é o seu tamanho da amostra? Dependendo do tamanho exato, os testes paramétricos podem fornecer estimativas razoavelmente boas.

Caso contrário, para uma alternativa não paramétrica, talvez você possa tentar o teste de Friedman .

Além disso, você pode tentar conduzir uma MANOVA para medidas repetidas, com uma variável de tempo explícita incluída, como uma alternativa a uma ANOVA mista 4x3. Uma grande diferença é que a suposição de esfericidade é relaxada (ou melhor, é estimada para você) e que todos os momentos da sua variável de resultado são ajustados de uma só vez.

Iris Tsui
fonte
FWIW, qualquer transformação de potência Box-Cox maior que 1 reduzirá a inclinação negativa. À luz da resposta de Rob Hyndman, essa não é a primeira coisa a tentar.
whuber
2

Uma transformação boxcox (existe uma no pacote MASS) também funciona em dados negativos e assimétricos. Para sua informação, você precisa inserir uma fórmula nessa função como y ~ 1 e garantir que todo y seja positivo primeiro (se não for apenas adicionar uma constante como abs (min (y))). Pode ser necessário ajustar o intervalo lambda na função para encontrar o pico da curva. Ele fornecerá o melhor valor lambda para você escolher e basta aplicar esta transformação:

b <- boxcox(y~1)
lambda <- b$x[b$y == max(b$y)]
yt <- (y^lambda-1)/lambda
#you can transform back with
ytb <- (t*lambda+1)^(1/lambda)

Veja se seus dados estão normais então.

#you can transform back with
ytb <- (t*lambda+1)^(1/lambda)
#maybe put back the min
ytb <- ytb - abs(min(y))
John
fonte