A saída da estatística W de wilcox.test () em R é igual à estatística U?

22

Li recentemente sobre o teste U de Mann-Whitney. Acontece que, para realizar este teste em R, você realmente precisa executar um teste de Wilcoxon!

Minha pergunta: a estatística W de wilcox.testem R é idêntica à estatística U?

luciano
fonte

Respostas:

25

Wilcoxon é geralmente creditado como o inventor original do teste *, embora a abordagem de Mann e Whitney tenha sido um grande avanço, e eles estenderam os casos para os quais a estatística foi tabulada. Minha preferência é me referir ao teste como Wilcoxon-Mann-Whitney, para reconhecer as duas contribuições (Mann-Whitney-Wilcoxon também é visto; também não me importo).

* No entanto, a imagem atual é um pouco mais nebulosa, com vários outros autores também apresentando estatísticas iguais ou semelhantes sobre esse período ou anteriores, ou, em alguns casos, fazendo contribuições que estão intimamente ligadas ao teste. Pelo menos parte do crédito deve ir para outro lugar.

O teste de Wilcoxon e o teste U de Mann-Whitney são equivalentes (e a ajuda afirma que são), pois sempre rejeitam os mesmos casos nas mesmas circunstâncias; no máximo, suas estatísticas de teste diferem apenas por uma mudança (e, em alguns casos, possivelmente uma mudança de sinal).

O teste de Wilcoxon é definido de mais de uma maneira na literatura (e essa ambiguidade remonta à tabulação original da estatística do teste, mais do que em um momento), portanto, é preciso ter cuidado com o que o teste de Wilcoxon está sendo discutido.

As duas formas mais comuns de definição são discutidas neste par de posts:

Teste da soma da classificação de Wilcoxon em R

Diferentes maneiras de calcular a estatística do teste para o teste da soma da classificação de Wilcoxon

Para abordar o que, especificamente, acontece no R:

A estatística usada wilcox.testem R é definida na ajuda ( ?wilcox.test), e a questão da relação com a estatística U de Mann-Whitney é explicada aqui:

A literatura não é unânime quanto às definições do somatório de Wilcoxon e dos testes de Mann-Whitney

As duas definições mais comuns correspondem à soma das classificações da primeira amostra com o valor mínimo subtraído ou não: R subtrai e S-PLUS não, fornecendo um valor que é maior em m (m + 1) / 2 para um valor primeira amostra de tamanho m. (Parece que o artigo original de Wilcoxon usava a soma não ajustada das classificações, mas as tabelas subsequentes subtraíam o mínimo.)

O valor de R também pode ser calculado como o número de todos os pares (x[i], y[j])para os quais y[j]não é maior que x[i], a definição mais comum do teste de Mann-Whitney.

Esta última frase responde completamente a esse aspecto da sua pergunta - a versão de W que R coloca * também é o valor de U.

n1(n1+1)2

Glen_b -Reinstate Monica
fonte
7

Tanto o teste da soma da classificação de Wilcoxon quanto o teste de Mann-Whitney são os equivalentes não paramétricos do teste t independente . Em alguns casos, a versão de W que R dá também é a valua de U. Mas não em todos os casos.

Quando você usa: wilcox.test(df$var1 ~ df$var2, paired=FALSE)o W fornecido é o mesmo que U. Portanto, você pode relatá-lo como a estatística U de Mann-Whitney.

No entanto, quando você usa:, wilcox.test(df$var1 ~ df$var2, paired=TRUE)você está realmente executando um teste de classificação assinado Wilcoxon. O teste de posto assinado de Wilcoxon é equivalente ao teste t dependente .

Fonte: "Descobrindo estatísticas usando R" por Andy Field (2013)

Jaap
fonte
1
É uma boa idéia ressaltar que, se você usar o argumento paired=TRUE, não é Wilcoxon-Mann-Whitney, mas a classificação assinada.
Glen_b -Reinstar Monica
1

Observe, no entanto, que o código: wilcox.test(df$var1 ~ df$var2, paired=FALSE)(usando '~')

produzirá uma estatística W diferente de a: wilcox.test(df$var1, df$var2, paired=FALSE)(usando ',')

Tilen
fonte
Bem-vindo ao site, @Tilen. Isso foi planejado como uma resposta à pergunta do OP, um comentário solicitando esclarecimentos ao OP ou a um dos respondentes ou uma nova pergunta sua? Por favor, use apenas o campo "Sua resposta" para fornecer respostas para a pergunta original. Você poderá comentar em qualquer lugar quando sua reputação for> 50. Se você tiver uma nova pergunta, clique no cinza ASK QUESTION na parte superior da página e faça a pergunta lá, podemos ajudá-lo adequadamente. Como você é novo aqui, convém fazer um tour , que contém informações para novos usuários.
gung - Restabelece Monica
Muito obrigado @gung. Na verdade, foi tipo de resposta e pergunta, eu acho. Obrigado pelas dicas. Estou ansioso para fazer parte disso.
Tilen 13/09/16
'Respostas' são apenas para respostas diretas à pergunta. Você pode editar isso para torná-lo mais puramente uma resposta?
gung - Restabelece Monica
Me desculpe por isso. Eu editei agora. Parece melhor agora?
Tilen 13/09/16
1
Não precisa se desculpar. Acho que sua resposta está implícita no que você colocou aqui, mas as pessoas terão que ler nas entrelinhas. Você pode explicitar e amarrar tudo em um arco? No entanto, não tenho certeza se isso está certo. Para usar a versão da fórmula, você precisa de um vetor de valores e um indicador de agrupamento. Por exemplo wilcox.test(values~ind, with(df, stack(var1=var1, var2=var2)), paired=FALSE),. Quando faço isso, fico do mesmo Wjeito.
gung - Restabelece Monica