Kolmogorov Smirnov Z vs Mann Whitney U pequena amostra n = 15?

8

Tenho uma amostra pequena de 15. Quero ver se há uma diferença na ingestão de nutrientes entre duas variáveis ​​independentes, grupo 1 n = 11, grupo 2 n = 4. Os dados não são normalmente distribuídos. Qual teste é mais apropriado, o teste Mann Whitney U ou Kolmogorov-Smirnov Z? O Discovering Statistics, de Andy Field, usando o SPSS, afirma que o KS Z deve ser usado para amostras pequenas:

Kolmogorov-Smirnov Z: No capítulo 5, encontramos um teste de Kolmogorov-Smirnov que testava se uma amostra era de uma população normalmente distribuída. Este é um teste diferente! De fato, ele testa se dois grupos foram selecionados da mesma população (independentemente de qual seja essa população). Com efeito, isso significa que faz o mesmo que o teste de Mann-Whitney! No entanto, esse teste tende a ter um poder melhor do que o teste de Mann-Whitney quando o tamanho da amostra é inferior a cerca de 25 por grupo e, portanto, vale a pena selecionar se for esse o caso.

Além disso, ao relatar as entradas juntamente com os valores de p, devo usar média e desvio padrão ou mediana e IQR, pois os dados não são paramétricos?

Qualquer conselho seria muito apreciado.

AMH40
fonte
3
Dados são o que são; são procedimentos e não dados não paramétricos ou paramétricos. Nesse caso, por favor, publique os dados. A não normalidade leve não é fatal para muitos procedimentos.
Nick Cox
2
Nesse texto de Field, consulte @whuber em stats.stackexchange.com/questions/157217/… "algumas das perguntas realmente confusas que temos neste site ... devem vir dos leitores desse livro. Está cheio de erros, desinformação e confabulação definitiva ".
Nick Cox
2
Eu também teria extrema cautela com esse livro. Seria melhor descobrir se há evidências de que as várias alegações citadas são verdadeiras do que apenas supor que estão corretas.
Glen_b -Reinstar Monica
Li essa pergunta como se você tivesse uma variável de resposta ou resultado e um preditor que define dois grupos. Os termos variáveis ​​dependentes e independentes são frequentemente lançados inadvertidamente, um dos vários argumentos para evitar esses termos, por mais familiares que sejam.
Nick Cox
A resposta excelente de @Glen_b naturalmente não lança luz sobre seus dados específicos. Ainda está aberto para você publicá-lo e permitir que as pessoas joguem com recomendações.
22617 Nick Cox

Respostas:

13

Se a declaração original não limitar as condições sob as quais se aplica de maneira substancial, Field está errado nisso.

Respondendo à seção citada:

Com efeito, isso significa que faz o mesmo que o teste de Mann-Whitney!

Não, realmente não. Eles realmente testam diferentes tipos de coisas. Como exemplo, se duas distribuições quase simétricas diferem na propagação, mas não diferem na localização, o Kolmogorov-Smirnov pode identificar esse tipo de diferença (em amostras grandes o suficiente em relação ao efeito), mas a Wilcoxon-Mann-Whitney não posso.

Isso ocorre porque eles são projetados para diferentes propósitos.

"No entanto, esse teste tende a ter melhor poder do que o teste de Mann-Whitney quando o tamanho da amostra é inferior a cerca de 25 por grupo, e vale a pena selecionar se for esse o caso".

n<25

[Pode haver alguma situação em que a afirmação é verdadeira; se Field não explicar em que contexto sua reivindicação se aplica, provavelmente não sou capaz de adivinhar.]

Aqui está uma curva de potência para n = 20 por grupo. O nível de significância é um pouco acima de 3% para cada teste (na verdade, o nível de significância alcançável para o KS é um pouco mais alto e eu não tentei usar um teste aleatório para ajustar essa diferença, de modo que foi dada uma pequena vantagem nessa comparação ):

Gráfico de potência em vários turnos para amostras normais sob turno alternativo em n = 20 em cada grupo

Como vemos, neste caso (o primeiro que tentei) o Wilcoxon-Mann-Whitney é claramente mais poderoso.

Em n = 5, o Kolmogorov-Smirnov permanece menos poderoso para esta situação. [Então, do que diabos ele está falando? Ele está comparando poder para alguma situação não mencionada na citação? Não sei, mas, seguindo o que é citado aqui, não devemos aceitar essa afirmação pelo valor de face. Foi errado na primeira coisa que verifiquei e - com base em uma familiaridade mais ampla com os dois testes, eu apostaria prontamente que isso é errado para várias outras situações.]

Nas amostras de 4 e 11 para alternativas de turno (e populações normais), novamente, o Wilcoxon-Mann-Whitney se sai melhor.

Com a variável que você está vendo, uma alternativa adequada provavelmente é algo mais como uma mudança de escala; mas se algum poder (como uma raiz quadrada ou raiz de cubo disser ou melhor ainda um log) de seus dados não for muito normal, esses resultados que eu mencionei devem ser relevantes. Se você tem dados discretos ou inflados com zero que podem fazer alguma diferença, mas minha aposta seria que o Kolmogorov-Smirnov não ultrapassa o Wilcoxon-Mann-Whitney. [Não vou prosseguir com isso no momento, porque não está claro se é relevante para a sua situação.]

Além disso, os níveis de significância alcançáveis ​​com o Kolmogorov-Smirnov são muito escassos em amostras pequenas. Geralmente, você não pode obter testes próximos dos níveis de significância usuais que provavelmente deseja. (O WMW se sai muito melhor que o KS em relação aos tamanhos de teste disponíveis. Existe uma maneira interessante de melhorar drasticamente essa situação de falta de níveis sem perder a natureza não paramétrica ou baseada em classificação de testes como esses - isso também não acontece. envolvem testes aleatórios - mas parece ser muito raramente usado por algum motivo.)

α=0.05

Se você estiver em uma situação em que o Wilcoxon-Mann-Whitney testa o que você deseja testar, eu definitivamente não recomendaria o uso do Kolmogorov-Smirnov. Eu usaria cada teste para o que eles foram projetados para testar, que é onde eles tendem a se sair bem.

A melhor maneira de descobrir o que é melhor é tentar algumas simulações em situações que seriam realistas para o tipo de dados que você terá. Então você pode ver quando faz o quê.

Além disso, ao relatar as entradas juntamente com os valores de p, devo usar média e desvio padrão ou mediana e IQR, pois os dados não são paramétricos?

Dados são apenas dados. Eles não são paramétricos nem não paramétricos - isso é uma propriedade dos modelos e procedimentos inferenciais que usamos, que dependem deles (estimativa, teste, intervalos). Paramétrico significa "definido até um número fixo e finito de parâmetros", que não é um atributo de dados, mas de modelos. Se você não pode simplesmente fornecer os dois conjuntos de valores (qual seria a minha preferência) e deve escolher um ou outro, o que é mais relevante cientificamente ou em relação à sua pergunta de interesse?

[Observe que Wilcoxon-Mann-Whitney não compara meios ou medianas (a menos que você adicione algumas suposições que aposto que não chegam nem perto de aplicar neste caso). Nem o Kolmogorov-Smirnov.]

Glen_b -Reinstate Monica
fonte