Como escolher entre o teste de sinais e o teste de postos assinados de Wilcoxon?

11

Estou tentando escolher um desses dois testes para analisar dados emparelhados. Alguém conhece alguma regra prática sobre qual escolher em geral?

Sheldon
fonte
A resposta do Silverfish apenas toca (apenas). Essa pergunta é bem geral, eu me pergunto se poderemos tolerar uma pergunta mais específica.
Glen_b -Reinstala Monica
Sheldon - o teste de classificação assinado carrega uma suposição sobre simetria das diferenças que o teste de sinal não possui. Por outro lado, se houver quase simetria e a cauda não for muito pesada, o rank assinado deverá ter mais poder.
Glen_b -Reinstala Monica
Concordo. No meu caso, o teste da soma da classificação tem o maior valor-p, o teste do sinal é o meio, a classificação assinada é a menor. Portanto, tem mais poder.
Sheldon
@Sheldon Não, não é assim que você decide que um teste tem mais poder - um valor p menor em relação a uma amostra pode ser simplesmente devido aos caprichos dessa amostra, enquanto poder é sobre o comportamento em todas as amostras aleatórias retiradas da mesma amostra. população. É melhor escrever uma resposta que se expanda nos comentários anteriores, explique o que significa ter mais poder e explique algumas das circunstâncias em que cada uma delas pode se sair melhor.
Glen_b -Reinstala Monica
3
@Glen_b, eu diria que atualmente a consideração mais importante é a que será mais útil para futuros leitores. Eu acho que quem procura por teste de sinal versus teste de Wilcoxon e encontra esse segmento, se beneficiará muito mais da leitura de sua resposta específica aqui do que de ser redirecionado para o mega-segmento em que é provável que se perca e nunca encontre resposta.
Ameba

Respostas:

9

Estou tentando escolher um desses dois testes para analisar dados emparelhados. Alguém conhece alguma regra prática sobre qual escolher em geral?

O teste de classificação assinado carrega uma suposição sobre a simetria das diferenças sob o nulo que o teste de sinal não precisa. (Essa suposição é necessária para que as permutações dos sinais anexados às fileiras de diferenças não assinadas sejam igualmente prováveis.)

Por outro lado, se houver quase simetria na população e a cauda não for muito pesada, o posto assinado deverá ter mais poder.

[Isso não deve ser tomado como conselho para escolher entre eles com base na amostra ; em geral, isso leva a propriedades de teste diferentes das nominais (os testes podem ser tendenciosos, os níveis de significância reais não são mais o que parecem ser, os valores de p calculados não representam valores de p verdadeiros e assim por diante). Em vez disso, sempre que possível, as características devem ser avaliadas com base no conhecimento externo à amostra à qual o teste é aplicado - seja pelo conhecimento da área de assunto, familiaridade com outros conjuntos de dados como este, separação de amostras, ...]

No meu caso, o teste de soma de classificação tem o maior valor-p, teste de sinal é o meio, classificação de sinal é o menor. Portanto, tem mais poder.

Não é assim que você decide que um teste tem mais poder - um valor p mais baixo em relação a uma amostra pode ser simplesmente devido aos caprichos dessa amostra, enquanto poder é sobre o comportamento em todas as amostras aleatórias retiradas da mesma população.

Ou seja, imagine que você esteja lidando com alguma situação específica em que a população de diferenças de pares esteja centrada um pouco longe de 0 (ou seja, que seja falso de uma maneira específica). Então, sob amostragem repetida nas mesmas condições (incluindo tamanho da amostra), a potência será a taxa de rejeição para essa população em particular.H0

De maneira semelhante, poderíamos calcular a taxa de rejeição para uma sequência de populações com localização diferente * das diferenças de pares e obter uma curva de potência inteira. Então "potência superior" corresponderia a toda a curva de potência (ou quase toda, observando que ambas deveriam estar no mesmo nível de significância) para um teste colocado acima do outro.

* você pode considerar uma mediana para a presente discussão - enquanto o estimador para o teste de classificação assinado é a mediana das médias pares de diferenças entre pares, sob a suposição de simetria, o estimador de localização também deve ser uma estimativa adequada do par mediano diferença.


Aqui está uma pergunta relacionada Como escolher entre o teste t ou não paramétrico, por exemplo, Wilcoxon em amostras pequenas . Uma das respostas inclui uma (breve) discussão sobre a presente questão.

Glen_b -Reinstate Monica
fonte
Obrigado pelo seu esclarecimento. Penso que a mensagem mais importante para levar para casa é a suposição sobre a simetria das diferenças no teste de classificação com sinal, que é violado no meu caso. Tenho a sensação de que, além de verificar se os critérios de simetria são satisfeitos, não há como saber qual teste está errado. Pelo contrário, parece razoável dizer qual é o mais apropriado.
Sheldon
11
@Sheldon Se você não está confiante de que as condições para o teste estão próximas da verdade, geralmente não deve assumir que estão. Ou seja, talvez o teste do sinal seja uma idéia melhor. Espero acrescentar mais informações à minha resposta quando tiver uma chance.
Glen_b -Reinstala Monica