Diferença entre o teste de soma de postos Wilcoxon e o teste de postos assinados de Wilcoxon

22

Eu queria saber qual é a diferença teórica entre o Teste de soma e classificação de Wilcoxon e o Teste de classificação e sinal de Wilcoxon usando observações emparelhadas. Eu sei que o teste de soma-classificação de Wilcoxon permite uma quantidade diferente de observações em duas amostras diferentes, enquanto o teste de classificação-assinada para amostras emparelhadas não permite isso, mas ambos parecem testar o mesmo na minha opinião. Alguém pode me dar mais algumas informações teóricas / de fundo quando alguém deve usar o Teste de Classificação de Soma de Wilcoxon e quando deve usar o Teste de Classificação de Sinal de Wilcoxon usando observações emparelhadas?

Floco de neve
fonte

Respostas:

25

Você deve usar o teste de classificação assinado quando os dados estiverem emparelhados .

Você encontrará muitas definições de emparelhamento, mas, no fundo, o critério é algo que torna os pares de valores pelo menos positivamente dependentes, enquanto os valores não pareados não são dependentes. Frequentemente, o pareamento de dependência ocorre porque são observações na mesma unidade (medidas repetidas), mas não precisa estar na mesma unidade, apenas de alguma forma tendendo a ser associado (enquanto mede o mesmo tipo de coisa) , para ser considerado como 'emparelhado'.

Você deve usar o teste de soma de classificação quando os dados não estiverem emparelhados.

Isso é basicamente tudo o que existe.

Observe que ter o mesmo não significa que os dados estão emparelhados e ter diferente não significa que não há emparelhamento (pode ser que alguns pares tenham perdido uma observação por algum motivo). O emparelhamento vem da consideração do que foi amostrado.nn

O efeito de usar um teste emparelhado quando os dados estão emparelhados é que geralmente fornece mais poder para detectar as alterações nas quais você está interessado. Se a associação leva a uma forte dependência *, o ganho de poder pode ser substancial.

* especificamente, mas falando de maneira um tanto vaga, se o tamanho do efeito for grande comparado ao tamanho típico das diferenças de pares, mas pequeno comparado ao tamanho típico das diferenças não emparelhadas, você poderá perceber a diferença com um teste emparelhado a tamanho de amostra bastante pequeno, mas com um teste não emparelhado apenas em um tamanho de amostra muito maior.

No entanto, quando os dados não estão emparelhados, pode ser (pelo menos um pouco) contraproducente tratar os dados como emparelhados. Dito isso, o custo - em energia perdida - pode, em muitas circunstâncias, ser bastante pequeno - um estudo de energia que fiz em resposta a essa pergunta parece sugerir que, em média, a perda de energia em situações típicas de pequenas amostras (digamos n da ordem de 10 a 30 em cada amostra, após o ajuste para diferenças no nível de significância) pode ser surpreendentemente pequeno.

[Se você tem alguma dúvida de saber se os dados estão emparelhados ou não, a perda no tratamento de dados não emparelhados como emparelhados é geralmente relativamente pequena, enquanto os ganhos podem ser substanciais se eles estiverem emparelhados. Isso sugere que, se você realmente não sabe, e tem uma maneira de descobrir o que está emparelhado com o que supõe que eles foram pareados - como os valores que estão na mesma linha de uma tabela, na prática, pode fazer sentido agir como se os dados estivessem emparelhados para serem seguros - embora algumas pessoas possam tender a se exercitar bastante com você.]

Glen_b -Reinstate Monica
fonte
7

Não sou pesquisador, mas sou especialista em estatística. Primeiro, mostrarei os requisitos para o WSRST (Wilcoxon Signed Rank Sum Test).

  • O WSRST exige que as populações sejam emparelhadas, por exemplo, o mesmo grupo de pessoas seja testado em duas ocasiões ou coisas diferentes e MEDIDO nos efeitos de cada uma e, em seguida, comparamos as duas coisas ou ocasiões.
  • O WSRST exige que os dados sejam quantitativos. Dados quantitativos são dados que são medidos ao longo de uma escala, por isso destaquei o mundo medido no primeiro ponto. Caso os participantes tenham sido solicitados a classificar suas respostas, você estará lidando com dados qualitativos, onde precisará usar o teste de sinais para testar sua hipótese.

[Existem outros requisitos para o WSRST, mas os que listei são suficientes para diferenciar os dois testes]

Agora, o Wilcoxon Rank Sum Test (WRST)

  • O principal requisito é que as amostras sejam coletadas de populações independentes. Por exemplo, você pode testar se a prova 1 é mais difícil que a prova 2 e, para fazer isso, você terá dois grupos de alunos e os grupos não precisam ter o mesmo tamanho. A partir do exemplo, os dois grupos são independentes; se você pediu ao mesmo grupo para escrever o mesmo artigo duas vezes, usará o WSRST para testar sua hipótese.
  • O outro requisito é que os dados não precisem ser quantitativos, ou seja, você também pode executar o teste em dados qualitativos.
S'busiso
fonte