Por que a eficiência relativa assintótica do teste de Wilcoxon

13

É sabido que a eficiência relativa assintótica (ARE) do teste de classificação assinado de Wilcoxon é 3π0.955comparado aotestetde Student, se os dados forem obtidos de uma população normalmente distribuída. Isso vale tanto para o teste básico de uma amostra quanto para a variante de duas amostras independentes (o Wilcoxon-Mann-Whitney U). Também é o ARE de um teste de Kruskal-Wallis comparado a um teste ANOVAF, para dados normais.

Esse resultado notável (para mim, uma das " aparências mais inesperadas deπ ") e notavelmente simples tem uma prova perspicaz, notável ou simples?

Silverfish
fonte
Dada a aparência de no cdf normal, o aparecimento de no ESTÃO não deve realmente ser tudo tão surpreendente. Vou arriscar uma resposta, mas levará um tempo para fazer uma boa. ππ
Glen_b -Reinstala Monica
1
@Glen_b De fato - eu já vi uma discussão "por que aparece tanto nas estatísticas" antes (embora não me lembre se estava no CV ou não) e "por causa da distribuição normal" eu sei que surgem muito , mas ainda é uma surpresa agradável na primeira vez em que você o vê. Para comparação, o ARE de Mann-Whitney vs o teste t de duas amostras é 3 em dados exponenciais, 1,5 em exponencial duplo e 1 em uniforme - muito mais arredondado! π3/π
Silverfish
1
@ Silververfish Liguei a página 197 da van der Vaart "Estatísticas Assintóticas". Para uma amostra, os testes de sinal têm ARE relação ao teste t. 2/π
Khashaa
1
@ Silverfish ... e na logística é . Existem algumas das AREs conhecidas (em um ou dois casos de amostra) envolvendo e algumas que são razões simples de números inteiros. (π/3)2π
Glen_b -Reinstala Monica
1
Para um teste de classificação assinado de uma amostra, parece ser . Para teste de sinal de uma amostra, é . Então, esclarecemos nossa posição. Eu acho que é um bom sinal. 3/π2/π
Khashaa

Respostas:

10

Breve esboço do ARE para o teste uma amostra , teste assinado e teste de classificação assinadat

Espero que a versão longa da resposta do @ Glen_b inclua análises detalhadas para o teste de classificação assinado de duas amostras, juntamente com a explicação intuitiva do ARE. Então, eu vou pular a maior parte da derivação. (caso de uma amostra, você pode encontrar os detalhes ausentes no TSH de Lehmann).

Problema de teste : Seja uma amostra aleatória do modelo de localização , simétrico em torno de zero. Devemos calcular ARE do teste assinado, teste de classificação assinado para a hipótese relação ao teste t.X1,,Xnf(xθ)H0:θ=0

Para avaliar a eficiência relativa dos testes, apenas alternativas locais são consideradas porque testes consistentes têm poder tendendo a 1 contra alternativa fixa. Alternativas locais que dão origem a poder assintótico não trivial geralmente têm a forma para fixo , que é chamado de desvio de Pitman em alguma literatura. hθn=h/nh

Nossa tarefa a frente é

  • encontre a distribuição limite de cada estatística de teste sob o valor nulo
  • encontre a distribuição limite de cada estatística de teste sob a alternativa
  • calcular o poder assintótico local de cada teste

Estatística de teste e assintóticos

  1. teste t (dada a existência de ) t n = σt n =
    tn=nX¯σ^dN(0,1)under the null
    tn=nX¯σ^dN(h/σ,1)under the alternative θ=h/n
    • portanto, o teste que rejeita se possui a função de potência assintótica 1 - Φ ( z α - h 1tn>zα
      1Φ(zαh1σ)
  2. teste assinado e possui poder assintótico local Sn=1ni=1n1{Xi>0}
    n(Sn12)dN(0,14)under the null 
    1 - Φ ( z α - 2 h f ( 0 ) )
    n(Sn12)dN(hf(0),14)under the alternative 
    1Φ(zα2hf(0))
  3. teste de classificação assinada e possui poder assintótico local W n d N ( 2 h f 2 , 1
    Wn=n2/3i=1nRi1{Xi>0}dN(0,13)under the null 
    1 - Φ ( z α -
    WndN(2hf2,13)under the alternative 
    1Φ(zα12hf2)

Portanto, Se for a densidade normal padrão, , A R E ( W n ) = (

UMARE(Sn)=(2f(0 0)σ)2
fARE(Sn)=2/πARE(Wn)=3/π
UMARE(Wn)=(12f2σ)2
fUMARE(Sn)=2/πUMARE(Wn)=3/π

Se for uniforme em [-1,1], ,A R E ( S n ) = 1 / 3 A R E ( W n ) = 1 / 3fUMARE(Sn)=1/3UMARE(Wn)=1/3

Comentários sobre a derivação da distribuição sob a alternativa

É claro que existem muitas maneiras de derivar a distribuição limitadora sob a alternativa. Uma abordagem geral é usar o terceiro lema de Le Cam. Versão simplificada dos estados

Seja o log da razão de verossimilhança. Para algumas estatísticas , se sob o valor nulo eW N ( W n , Δ n ) d N [ ( μ - σ 2 / 2 ) , ( σ 2 W τ τ σ 2 / 2 ) ]ΔnWn

(Wn,Δn)dN[(μ-σ2/2),(σW2ττσ2/2)]
WndN(μ+τ,σW2)sob a alternativa

Para densidades diferenciáveis ​​médias quadráticas, a normalidade e contiguidade assintótica local são automaticamente satisfeitas, o que implica lema de Le Cam. Usando esse lema, precisamos apenas calcular sob o valor nulo. obedece a LAN onde está função de pontuação, é matriz de informações. Então, por exemplo, para o teste assinadocov(Wn,Δn)Δn

ΔnhnEu=1neu(XEu)-12h2Eu0 0
euEu0 0Sn
cov(n(Sn-1/2),Δn)=-hcov(1{XEu>0 0},ff(XEu))=h0 0f=hf(0 0)
Khashaa
fonte
+1 Eu não iria entrar em tantos detalhes (de fato, com sua resposta já cobrindo as coisas muito bem, provavelmente não adicionarei nada ao que tenho agora). Portanto, se você quiser colocar mais detalhes, não Não esconda minha conta. Eu já passaria vários dias (e ainda por menos do que você já tem), por isso é uma coisa boa que você tenha entrado.
Glen_b -Reinstata Monica
Esta é uma boa resposta especialmente para adicionar o lema de Le Cam (+1). Parece-me que há um grande salto entre estabelecer os assintóticos em 1, 2 e 3, e a parte "portanto" em que você escreve as AREs. Eu acho que se eu estivesse escrevendo isso, eu definiria a eficiência assintótica neste momento (ou talvez antes, para que o resultado dos pontos 1, 2 e 3 sejam os EAs, não apenas os poderes assintóticos locais em cada caso) e, em seguida, a etapa para as AREs seria muito mais fácil para futuros leitores seguirem.
Silverfish 01/01
Talvez valha a pena especificar o seu ? Casos unilaterais e bilaterais têm poderes assintóticos de aparência diferente (embora levem às mesmas AREs). H1
Silverfish 01/01
Sinta-se à vontade para editar minha resposta ou anexá-la ao OP.
Khashaa
1
@Khashaa Thanks. Editarei sua postagem quando tiver as coisas certas à minha frente. Você se importaria de esclarecer o significado do na equação final?
Silverfish
6

Isso não tem nada a ver com explicar por que aparece (o que foi explicado muito bem por outros), mas pode ajudar intuitivamente. O teste de Wilcoxon é um teste nas fileiras de enquanto o teste paramétrico é computado nos dados brutos. A eficiência do teste de Wilcoxon em relação ao teste é o quadrado da correlação entre as pontuações utilizadas para os dois testes. Como a correlação ao quadrado converge para . Você pode ver isso empiricamente usando R:πtYtnπ3

n <- 1000000; x <- qnorm((1:n)/(n+1)); cor(1:n, x)^2; 3/pi
[1] 0.9549402
[1] 0.9549297
n <- 100000000; x <- qnorm((1:n)/(n+1)); cor(1:n, x)^2; 3/pi
[1] 0.9549298
[1] 0.9549297
Frank Harrell
fonte
Este é realmente um comentário muito útil. É um pouco conceitualmente mais próximo de fazer n <- 1e6; x <- rnorm(n); cor(x, rank(x))^2(o que obviamente produz o mesmo resultado)?
Silverfish 01/01
(As pessoas intrigado com o comentário de Frank pode querer olhar para esta questão sobre a equivalência de Wilcoxon-Mann-Whitney U e uma t -teste nas fileiras .)
Silverfish
nnn
Para minha lembrança, a pequena eficiência da amostra, tanto no teste de posto assinado de Wilcoxon quanto no WMW, é um pouco menor que o valor assintótico nas alternativas de turno na distribuição normal.
Glen_b -Reinstar Monica
5

12σ2[f2(x)dx]2fσ

f2f1ππ

O mesmo termo - com a mesma integral - está envolvido no ARE para o teste de classificação assinado, portanto, assume o mesmo valor.

4σ2f(0 0)2f(0 0)2π

π

Referência:

JL Hodges e EL Lehmann (1956),
"A eficiência de alguns concorrentes não paramétricos do teste t",
Ann. Matemática. Statist. , 27 : 2, 324-335.

Glen_b -Reinstate Monica
fonte
π
f2dx
α=2