Em que situação o Wilcoxon Signed-Rank Test seria preferível ao t-Test ou Sign Test?

10

Após algumas discussões (abaixo), agora tenho uma imagem mais clara de uma pergunta focada, então aqui está uma pergunta revisada, embora alguns dos comentários possam parecer desconectados da pergunta original.

Parece que os testes t convergem rapidamente para distribuições simétricas , que o teste de classificação assinada assume simetria e que, para uma distribuição simétrica, não há diferença entre médias / pseudomediantes / medianas. Em caso afirmativo, em que circunstâncias um estatístico relativamente inexperiente consideraria útil o teste de classificação com sinal, quando ele tem o teste t e o teste de sinal disponíveis? Se um dos meus alunos (por exemplo, ciências sociais) está tentando testar se um tratamento tem desempenho melhor que outro (por alguma medida relativamente facilmente interpretada, por exemplo, alguma noção de diferença "média"), estou lutando para encontrar um lugar para o teste de classificação, mesmo que pareça geralmente ser ensinado, e o teste de sinais ignorado, na minha universidade.

apenas eu
fonte
11
Justme: claro, eu não pensei nisso.
22816 JonB
11
Depende de quem você conhece a sabedoria convencional; minha experiência é muito diferente da sua. Certamente, é fácil encontrar recursos que indiquem claramente que a simetria das pontuações de diferenças é assumida sob o valor nulo (e que é importante). Mas observe que isso está abaixo do nulo - como resultado, encontrar falta de simetria nas pontuações das diferenças em uma amostra não é necessariamente relevante - você não precisa ter simetria sob a alternativa. Se você é altamente confiante de que se o nulo fosse verdade a simetria iria realizar - e em muitos casos é uma suposição muito plausível - ... CTD
Glen_b -Reinstate Monica
11
DCT ... então não há problema. O problema é que, se você não está preparado para assumi-lo de antemão, não sabe se uma rejeição foi causada por falha de suposição; o óbvio a ser feito simplesmente não é assumi-lo.
Glen_b -Reinstala Monica 23/11
2
Analisando seu segundo comentário primeiro: (além do que você já mencionou), observe que 1. as suposições normais não esgotam os testes paramétricos. 2. O teste de classificação assinado não é, na verdade, um teste de medianas, mas de estatísticas / pseudomediantes de Hodges-Lehmann de uma amostra (embora se você adicionar a suposição de simetria à alternativa, ele também testará medianas e onde existem meios, também por meios, entre muitas outras coisas). Da mesma forma, o teste da soma das classificações não é um teste de medianas, mas de diferenças medianas aos pares. Você está certo de que o nível do teste de classificação assinado pode ser bastante sensível à assimetria.
Glen_b -Reinstala Monica 23/11
2
Em seu comentário anterior: 1 A simetria geralmente não é vista como parte do nulo, mas como parte das suposições necessárias para que as permutações sejam permutáveis ​​sob o nulo. 2. Como mencionado anteriormente, não é realmente um teste de medianas, mas de pseudomediantes, e isso vale mesmo sob uma alternativa assimétrica. É verdade que a interpretação às vezes é mais fácil se você fizer algumas suposições restritivas, mas as restrições necessárias para torná-la um teste razoável para medianas não precisam ser tão rigorosas quanto assumir simetria sob a alternativa.
Glen_b -Reinstala Monica 23/11

Respostas:

3

Considere uma distribuição de diferenças de pares que seja um pouco mais pesada do que o normal, mas não especialmente "pontiaguda"; então, frequentemente, o teste de classificação assinado tenderá a ser mais poderoso que o teste t, mas também mais poderoso que o teste de sinal.

Por exemplo, na distribuição logística, a eficiência relativa assintótica do teste de classificação assinado em relação ao teste t é de 1,097, portanto, o teste de classificação assinado deve ser mais poderoso que o t (pelo menos em amostras maiores), mas a eficiência relativa assintótica do teste de sinal em relação ao teste t é 0,822, portanto o teste de sinal seria menos poderoso que o t (novamente, pelo menos em amostras maiores).

À medida que avançamos para distribuições de cauda mais pesada (embora ainda evitemos as de pico excessivo), o t tenderá a ter um desempenho relativamente pior, enquanto o teste de sinais deve melhorar um pouco, e o sinal e a classificação assinada irão superar o t na detecção de pequenas efeitos por margens substanciais (ou seja, serão necessários tamanhos de amostra muito menores para detectar um efeito). Haverá uma grande classe de distribuições para a qual o teste de classificação com sinal é o melhor dos três.

t3tδ

No gráfico das curvas de potência para o t, Wilcoxon assinou testes de classificação e sinal com n = 100 e nível de significância de 5% para o t3

Como podemos ver na plotagem, o teste de classificação assinado tem mais poder que o teste de sinais, que por sua vez tem mais poder que o teste t.

Glen_b -Reinstate Monica
fonte
Muito obrigado por este @Glen_b! Ainda estou lutando para descobrir onde ele se encaixa em nosso currículo, quando temos alunos para quem até o conceito de poder está além do escopo de seus estudos e por que ensinamos Wilcoxon como a principal alternativa ao t emparelhado. Mas isso dá algumas motivações úteis. Obrigado!
Just
Aliás, depois de considerar qual característica distributiva afeta a variação assintótica da mediana (e, portanto, a potência do teste de sinal), ocorreu-me um exemplo em que as posições relativas do teste de sinal t são revertidas; como resultado, acho que há uma boa possibilidade de construir um caso em que o teste de classificação assinado possa ter um desempenho consideravelmente melhor do que qualquer um dos outros dois testes. Vou brincar mais quando puder e talvez escrever algo sobre isso.
Glen_b -Reinstar Monica
No que diz respeito ao seu plano de estudos, é claro que há definitivamente casos em que a classificação assinada supera os outros dois testes (como descrevi em minhas respostas - distribuições que são um pouco mais pesadas do que o normal, mas não especialmente pontuais); o t é melhor no normal ou mais leve, e o teste do sinal é melhor quando a distribuição tem um pico forte (que geralmente tende a combinar com caudas muito pesadas, mas não precisa). [Cuidado, porém, confundindo essas idéias com meras mudanças no spread, que não alteram as suas propriedades relativas.] ... Eu tenho certeza que você poderia espremer algumas dessas frases
Glen_b -Reinstate Monica
Muito obrigado @Glen_b! O problema é que não estou ensinando o currículo, apenas apoiando-o! O plano de estudos na maioria dos departamentos parece ser: (i) use um teste de hipótese de normalidade (mate-me agora) e com base nisso (ii) use Wilcoxon ou t-Test. Portanto, os detalhes mais delicados dos ombros da distribuição, etc, nunca são tocados, e também não é poder, apenas se as suposições são atendidas (de uma maneira levemente inútil). Mas seus pensamentos são muito úteis para mim pessoalmente, pelo menos!
Just
Ótimo post @Glen_b! Portanto, em termos de seleção entre os dois testes, posso concluir que devemos sempre calcular primeiro o poder? Em vez de seguir a suposição de que sempre usa o Teste de sinal se a distribuição da diferença não for normal? Obrigado!
Lumos 29/05