Esta é uma pergunta posterior ao que Frank Harrell escreveu aqui :
Na minha experiência, o tamanho da amostra necessário para que a distribuição t seja precisa é geralmente maior que o tamanho da amostra em questão. O teste de postos assinados de Wilcoxon é extremamente eficiente, como você disse, e é robusto, então eu quase sempre prefiro o teste t
Se eu entendi direito - ao comparar a localização de duas amostras sem correspondência, preferimos usar o teste de soma e classificação de Wilcoxon sobre o teste t não pareado, se o tamanho da amostra for pequeno.
Existe uma situação teórica em que preferimos o teste de soma e classificação de Wilcoxon ao teste t não pareado, mesmo que o tamanho da amostra de nossos dois grupos seja relativamente grande?
Minha motivação para esta pergunta decorre da observação de que, para um único teste t de amostra, usá-lo para uma amostra não tão pequena de uma distribuição distorcida resultará em um erro incorreto do tipo I:
n1 <- 100
mean1 <- 50
R <- 100000
P_y1 <- numeric(R)
for(i in seq_len(R))
{
y1 <- rexp(n1, 1/mean1)
P_y1[i] <- t.test(y1 , mu = mean1)$p.value
}
sum(P_y1<.05) / R # for n1=n2=100 -> 0.0572 # "wrong" type I error
fonte
Respostas:
Sim existe. Por exemplo, qualquer amostragem de distribuições com variação infinita destruirá o teste t, mas não o Wilcoxon. Referindo-se a métodos estatísticos não paramétricos (Hollander e Wolfe), vejo que a eficiência relativa assintótica (ARE) do Wilcoxon em relação ao teste t é 1,0 para a distribuição uniforme, 1,097 (ou seja, Wilcoxon é melhor) para a logística, 1,5 para o exponencial duplo (Laplace) e 3,0 para o exponencial.
Hodges e Lehmann mostraram que o ARE mínimo do Wilcoxon em relação a qualquer outro teste é 0,864, portanto, você nunca pode perder mais de 14% de eficiência usando-o em relação a qualquer outra coisa. (Obviamente, esse é um resultado assintótico.) Consequentemente, o uso de Wilcoxon como padrão por Frank Harrell provavelmente deve ser adotado por quase todos, inclusive eu.
Edit: Respondendo à pergunta de acompanhamento nos comentários, para aqueles que preferem intervalos de confiança, o estimador de Hodges-Lehmann é o estimador que "corresponde" ao teste de Wilcoxon, e os intervalos de confiança podem ser construídos em torno disso.
fonte
Deixe-me trazê-lo de volta à nossa discussão nos comentários a esta sua pergunta. O teste de soma-classificação de Wilcoxon é equivalente ao teste U de Mann-Whitney (e sua extensão direta para mais de duas amostras é denominada teste de Kruskal-Wallis). Você pode ver na Wikipedia e também neste texto que Mann-Whitney (ou Kruskal-Wallis) geralmente não compara meios ou medianas. Ele compara a prevalência geral de valores: qual das amostras é "estocisticamente maior". O teste é livre de distribuição. O teste T compara as médias. Assume distribuição normal. Então, os testes se envolvem em diferentes hipóteses. Na maioria dos casos, não planejamos comparar especificamente as médias; queremos saber qual amostra é maior por valores e isso torna Mann-Whitney o teste padrão para nós. Por outro lado, quando ambas as distribuições são simétricas, a tarefa de testar se uma amostra é "maior" que a outra degenera na tarefa de comparar as duas médias e, em seguida, se as distribuições são normais com variações iguais, o teste t torna-se um tanto mais poderoso.
fonte