É sabido que a eficiência relativa assintótica (ARE) do teste de classificação assinado de Wilcoxon é comparado aotestetde Student, se os dados forem obtidos de uma população normalmente distribuída. Isso vale tanto para o teste básico de uma amostra quanto para a variante de duas amostras independentes (o Wilcoxon-Mann-Whitney U). Também é o ARE de um teste de Kruskal-Wallis comparado a um teste ANOVAF, para dados normais.
Esse resultado notável (para mim, uma das " aparências mais inesperadas de ") e notavelmente simples tem uma prova perspicaz, notável ou simples?
Respostas:
Breve esboço do ARE para o teste uma amostra , teste assinado e teste de classificação assinadat
Espero que a versão longa da resposta do @ Glen_b inclua análises detalhadas para o teste de classificação assinado de duas amostras, juntamente com a explicação intuitiva do ARE. Então, eu vou pular a maior parte da derivação. (caso de uma amostra, você pode encontrar os detalhes ausentes no TSH de Lehmann).
Problema de teste : Seja uma amostra aleatória do modelo de localização , simétrico em torno de zero. Devemos calcular ARE do teste assinado, teste de classificação assinado para a hipótese relação ao teste t.X1,…,Xn f(x−θ) H0:θ=0
Para avaliar a eficiência relativa dos testes, apenas alternativas locais são consideradas porque testes consistentes têm poder tendendo a 1 contra alternativa fixa. Alternativas locais que dão origem a poder assintótico não trivial geralmente têm a forma para fixo , que é chamado de desvio de Pitman em alguma literatura. hθn=h/n−−√ h
Nossa tarefa a frente é
Estatística de teste e assintóticos
Portanto, Se for a densidade normal padrão, , A R E ( W n ) = ( √
Se for uniforme em [-1,1], ,A R E ( S n ) = 1 / 3 A R E ( W n ) = 1 / 3f A R E( Sn) = 1 / 3 A R E( Wn) = 1 / 3
Comentários sobre a derivação da distribuição sob a alternativa
É claro que existem muitas maneiras de derivar a distribuição limitadora sob a alternativa. Uma abordagem geral é usar o terceiro lema de Le Cam. Versão simplificada dos estados
Para densidades diferenciáveis médias quadráticas, a normalidade e contiguidade assintótica local são automaticamente satisfeitas, o que implica lema de Le Cam. Usando esse lema, precisamos apenas calcular sob o valor nulo. obedece a LAN onde está função de pontuação, é matriz de informações. Então, por exemplo, para o teste assinadoc o v ( Wn, Δn) Δn
fonte
Isso não tem nada a ver com explicar por que aparece (o que foi explicado muito bem por outros), mas pode ajudar intuitivamente. O teste de Wilcoxon é um teste nas fileiras de enquanto o teste paramétrico é computado nos dados brutos. A eficiência do teste de Wilcoxon em relação ao teste é o quadrado da correlação entre as pontuações utilizadas para os dois testes. Como a correlação ao quadrado converge para . Você pode ver isso empiricamente usando R:π t Y t n → ∞ π3
fonte
n <- 1e6; x <- rnorm(n); cor(x, rank(x))^2
(o que obviamente produz o mesmo resultado)?O mesmo termo - com a mesma integral - está envolvido no ARE para o teste de classificação assinado, portanto, assume o mesmo valor.
Referência:
JL Hodges e EL Lehmann (1956),
"A eficiência de alguns concorrentes não paramétricos do teste t",
Ann. Matemática. Statist. , 27 : 2, 324-335.
fonte