Diferença entre ANOVA e teste de Kruskal-Wallis

20

Estou aprendendo R e tenho experimentado análises de variância. Eu tenho executado ambos

kruskal.test(depVar ~ indepVar, data=df)

e

anova(lm(depVar ~ indepVar, data=dF))

Existe uma diferença prática entre esses dois testes? Meu entendimento é que ambos avaliam a hipótese nula de que as populações têm a mesma média.

JHowIX
fonte

Respostas:

28

Existem diferenças nas premissas e hipóteses testadas.

A ANOVA (e teste t) é explicitamente um teste de igualdade de médias de valores. O Kruskal-Wallis (e Mann-Whitney) pode ser visto tecnicamente como uma comparação das classificações médias .

Portanto, em termos de valores originais, o Kruskal-Wallis é mais geral do que uma comparação de médias: testa se a probabilidade de uma observação aleatória de cada grupo ter a mesma probabilidade de estar acima ou abaixo de uma observação aleatória de outro grupo. A quantidade real de dados subjacente a essa comparação não é nem as diferenças de média nem a diferença de medianas (no caso das duas amostras) é na verdade a mediana de todas as diferenças aos pares - a diferença de Hodges-Lehmann entre amostras.

No entanto, se você optar por fazer algumas suposições restritivas, Kruskal-Wallis pode ser visto como um teste de igualdade de meios populacionais, bem como quantis (por exemplo, medianas) e, de fato, uma grande variedade de outras medidas. Ou seja, se você assumir que as distribuições de grupo sob a hipótese nula são as mesmas, e que sob a alternativa, a única mudança é uma mudança de distribuição (a chamada " alternativa de mudança de localização " "), também é um teste igualdade de meios populacionais (e, simultaneamente, de medianas, quartis inferiores, etc.).

[Se você fizer essa suposição, poderá obter estimativas e intervalos para os turnos relativos, da mesma forma que na ANOVA. Bem, também é possível obter intervalos sem essa suposição, mas são mais difíceis de interpretar.]

Se você olhar para a resposta aqui , especialmente no final, ele discute a comparação entre o teste t e o Wilcoxon-Mann-Whitney, que (ao fazer testes de duas caudas pelo menos) são equivalentes a ANOVA e Kruskal-Wallis aplicado a uma comparação de apenas duas amostras; dá um pouco mais de detalhes, e grande parte dessa discussão é transmitida ao Kruskal-Wallis vs ANOVA.

Não está completamente claro o que você quer dizer com diferença prática. Você os usa geralmente de uma maneira geralmente semelhante. Quando os dois conjuntos de suposições se aplicam, eles geralmente tendem a fornecer resultados bastante semelhantes, mas certamente podem fornecer valores-p bastante diferentes em algumas situações.

Edit: Aqui está um exemplo da semelhança de inferência, mesmo em amostras pequenas - aqui está a região de aceitação conjunta para as mudanças de localização entre três grupos (o segundo e o terceiro cada um comparados ao primeiro) amostrados de distribuições normais (com tamanhos de amostra pequenos) para um conjunto de dados específico, no nível de 5%:

Regiões de aceitação para diferenças de localização em Kruskal-Wallis e Anova

É possível discernir várias características interessantes - a região de aceitação um pouco maior para o KW nesse caso, com seu limite consistindo em segmentos de linha reta verticais, horizontais e diagonais (não é difícil descobrir por que). As duas regiões nos dizem coisas muito semelhantes sobre os parâmetros de interesse aqui.

Glen_b -Reinstate Monica
fonte
2
+1. Atrevi-me a editá-lo um pouco apenas para acrescentar ênfase onde eu achava necessário. Por favor, veja agora, se você concorda ou não.
ttnphns
@ttnphns obrigado pela edição. Existem algumas razões particulares pelas quais algumas das coisas que você alterou estavam lá, para que eu possa editar algumas das originais. No entanto, talvez eu deva deixar mais claro o motivo pelo qual escrevi como antes. Mas primeiro quero pensar cuidadosamente sobre a melhor forma de manter o máximo de suas alterações possível.
Glen_b -Reinstala Monica 10/11
4

Sim existe. A anovaé uma abordagem paramétrica, enquanto kruskal.testé uma abordagem não paramétrica. Portanto kruskal.test, não precisa de nenhuma suposição distributiva.
Do ponto de vista prático, quando seus dados estão distorcidos, anovanão seria uma boa abordagem para usar. Dê uma olhada nesta pergunta, por exemplo.

Stat
fonte
4
Eu diria que a ANOVA de Kruskal-Wallis faz suposições relaxadas em relação às distribuições em comparação com a ANOVA paramétrica: as observações em cada grupo vêm de populações com forma semelhante . A heterocedasticidade ou as distribuições altamente distorcidas permanecem tão problemáticas quanto nos testes tradicionais.
chl
2
Como assim, @chl? As classificações não são alteradas por inclinação, e o KW é baseado em classificação. o que estou perdendo?
Peter Flom - Restabelece Monica
6
3/π
H0 0
1
@ StéphaneLaurent Se as formas não forem idênticas, pode levar a más inferência. veja meu exemplo aqui
Flask
3

Δinsira a descrição da imagem aqui

()H0:{Δ=0}H1:{Δ0}()H0H0)()H0:{the distributions are equal}

()Δ>0Δ

xyn=1000H0

set.seed(666)
n <- 1000
x <- rnorm(n)
y <- (2*rbinom(n,1,1/2)-1)*rnorm(n,3)
plot(density(x, from=min(y), to=max(y)))
lines(density(y), col="blue")

enter image description here

> kruskal.test(list(x,y))

    Kruskal-Wallis rank sum test

data:  list(x, y)
Kruskal-Wallis chi-squared = 2.482, df = 1, p-value = 0.1152

Como afirmei no começo, não tenho certeza da construção precisa do KW. Talvez minha resposta esteja mais correta para outro teste não paramétrico (Mann-Whitney? ..), mas a abordagem deve ser semelhante.

Stéphane Laurent
fonte
1
Kruskal-Wallis test is constructed in order to detect a difference between two distributions having the same shape and the same dispersionComo mencionado na resposta de Glen, nos comentários e em muitos outros lugares deste site, é verdade, mas é a leitura restrita do que o teste faz. same shape/dispersionNa verdade, não é intrínseco, mas é uma suposição adicional usada em algumas situações e não em outras situações.
ttnphns
PS Seu segundo exemplo não contradiz nem refuta o teste KW. O H0 do teste não é distributions are equal, é um erro pensar assim. O H0 é apenas que, figularmente, os dois pontos de "condensação das gravidades" não se desviam um do outro.
ttnphns
H0
1
krusal.test()H0
1
Sim. the equality of the location parameters of the distributioné a formulação correta (embora "local" não deva ser considerado apenas uma média ou mediana, em geral). Se você assumir as mesmas formas, naturalmente, esse mesmo H0 se tornará "distribuição idêntica".
ttnphns
0

Kruskal-Wallis é baseado em classificação, e não em valor. Isso pode fazer uma grande diferença se houver distribuições distorcidas ou se houver casos extremos

Peter Flom - Restabelecer Monica
fonte