Você deve usar o teste de classificação assinado quando os dados estiverem emparelhados .
Você encontrará muitas definições de emparelhamento, mas, no fundo, o critério é algo que torna os pares de valores pelo menos positivamente dependentes, enquanto os valores não pareados não são dependentes. Frequentemente, o pareamento de dependência ocorre porque são observações na mesma unidade (medidas repetidas), mas não precisa estar na mesma unidade, apenas de alguma forma tendendo a ser associado (enquanto mede o mesmo tipo de coisa) , para ser considerado como 'emparelhado'.
Você deve usar o teste de soma de classificação quando os dados não estiverem emparelhados.
Isso é basicamente tudo o que existe.
Observe que ter o mesmo não significa que os dados estão emparelhados e ter diferente não significa que não há emparelhamento (pode ser que alguns pares tenham perdido uma observação por algum motivo). O emparelhamento vem da consideração do que foi amostrado.nn
O efeito de usar um teste emparelhado quando os dados estão emparelhados é que geralmente fornece mais poder para detectar as alterações nas quais você está interessado. Se a associação leva a uma forte dependência *, o ganho de poder pode ser substancial.
* especificamente, mas falando de maneira um tanto vaga, se o tamanho do efeito for grande comparado ao tamanho típico das diferenças de pares, mas pequeno comparado ao tamanho típico das diferenças não emparelhadas, você poderá perceber a diferença com um teste emparelhado a tamanho de amostra bastante pequeno, mas com um teste não emparelhado apenas em um tamanho de amostra muito maior.
No entanto, quando os dados não estão emparelhados, pode ser (pelo menos um pouco) contraproducente tratar os dados como emparelhados. Dito isso, o custo - em energia perdida - pode, em muitas circunstâncias, ser bastante pequeno - um estudo de energia que fiz em resposta a essa pergunta parece sugerir que, em média, a perda de energia em situações típicas de pequenas amostras (digamos n da ordem de 10 a 30 em cada amostra, após o ajuste para diferenças no nível de significância) pode ser surpreendentemente pequeno.
[Se você tem alguma dúvida de saber se os dados estão emparelhados ou não, a perda no tratamento de dados não emparelhados como emparelhados é geralmente relativamente pequena, enquanto os ganhos podem ser substanciais se eles estiverem emparelhados. Isso sugere que, se você realmente não sabe, e tem uma maneira de descobrir o que está emparelhado com o que supõe que eles foram pareados - como os valores que estão na mesma linha de uma tabela, na prática, pode fazer sentido agir como se os dados estivessem emparelhados para serem seguros - embora algumas pessoas possam tender a se exercitar bastante com você.]