Valor esperado da estatística de pedido mínimo de uma amostra normal

9

ATUALIZAÇÃO 25 de janeiro de 2014: o erro agora está corrigido. Ignore os valores calculados do Valor esperado na imagem carregada - eles estão errados. Não excluo a imagem porque ela gerou uma resposta a esta pergunta.

ATUALIZAÇÃO 10 de janeiro de 2014: o erro foi encontrado - um erro de digitação em matemática em uma das fontes utilizadas. Preparando correção ...

A densidade da ordem estatística mínima de um conjunto de iid variáveis aleatórias contínuas com CDF e pdf é F X ( x ) f X ( x ) f X ( 1 ) ( x ( 1 ) ) = n f X ( x ( 1 ) ) [ 1 - F X ( x ( 1 ) ) ] n - 1nFX(x)fX(x)

fX(1)(x(1))=nfX(x(1))[1FX(x(1))]n1[1]

Se essas variáveis ​​aleatórias forem normais padrão, então

fX(1)(x(1))=nϕ(x(1))[1Φ(x(1))]n1=nϕ(x(1))[Φ(x(1))]n1[2]
e, portanto, seu valor esperado é
E(X(1))=nx(1)ϕ(x(1))[Φ(x(1))]n1dx(1)[3]

onde usamos as propriedades simétricas do padrão normal. Em Owen 1980 , p.402, eq. [ N, 011 ], encontramos que

zϕ(z)[Φ(az)]mdz=am(a2+1)(2π)ϕ(z)[Φ(aza2+1)]m1dz[4]

Parâmetros correspondentes entre as eqs [3] e [4] ( a=1 , m=n1 ) obtemos

E(X(1))=n(n1)2πϕ(x(1))[Φ(x(1)2)]n2dx(1)[5]

Novamente em Owen 1980, p. 409, eq [ n0,010.2 ], achamos que

[i=1mΦ(hidiz1di2)]ϕ(z)dz=Zm(h1,...,hm;{ρij})[6]

onde é o normal multivariado padrão, são os coeficientes de correlação pares e .Zm()ρij=didj,ij1di1

Combinando e , temos, , e [5][6]m=n2hi=0,i

di1di2=12di=±13iρij=ρ=1/3

Usando esses resultados, a eq se torna[5]

E(X(1))=n(n1)2πZn2(0,...,0;ρ=1/3)[7]

Essa integral de probabilidade normal padrão multivariada de variáveis ​​equi-correlacionadas, todas avaliadas em zero , já foi investigada o suficiente e várias formas de aproximar e computar foram derivadas. Uma extensa revisão (relacionada ao cálculo de integrais de probabilidade normal multivariada em geral) é Gupta (1963) . O Gupta fornece valores explícitos para vários coeficientes de correlação e para até 12 variáveis ​​(portanto, abrange uma coleção de 14 variáveis). Os resultados são (A ÚLTIMA COLUNA ESTÁ ERRADA) :

insira a descrição da imagem aqui

Agora, se representarmos graficamente como o valor de muda com , obteremosZn2(0,...,0;ρ=1/3)n

insira a descrição da imagem aqui

Portanto, chego às minhas três perguntas / solicitações:
1) Alguém poderia verificar analiticamente e / ou verificar por simulação se os resultados para o valor esperado estão corretos (ou seja, verificar a validade da eq )?[7]

2) Supondo que a abordagem esteja correta, alguém poderia dar a solução para normais com média diferente de zero e variação não unitária? Com todas as transformações, sinto-me realmente tonto.

3) O valor da integral de probabilidade parece evoluir sem problemas. Que tal aproximá-lo com alguma função de ?n

Alecos Papadopoulos
fonte

Respostas:

6

Seus resultados não parecem corretos. É fácil ver, sem qualquer cálculo, porque na sua tabela, seu aumenta com o tamanho da amostra ; claramente, o valor esperado do mínimo da amostra deve diminuir (isto é, tornar-se mais negativo) à medida que o tamanho da amostra aumenta.E[X(1)] nn

O problema é conceitualmente bastante fácil.

Em resumo: se ~ com pdf :XN(0,1)f(x)

insira a descrição da imagem aqui

... então o pdf da estatística de 1ª ordem (em uma amostra de tamanho ) é:n

insira a descrição da imagem aqui

... obtido aqui usando a OrderStatfunção in mathStatica, com domínio de suporte:

insira a descrição da imagem aqui

Então, , para pode ser facilmente obtido exatamente como:E[X(1)]n=1,2,3

insira a descrição da imagem aqui

O caso exato de é aproximadamente , o que é obviamente diferente do seu trabalho de -1,06 (linha 1 da sua tabela); portanto, parece claro que algo está errado com o seu funcionamento (ou talvez meu entendimento do que você está procurando) .n=30.846284

Para , obter soluções em formato fechado é mais complicado, mas mesmo que a integração simbólica seja difícil, sempre podemos usar a integração numérica (com precisão arbitrária, se desejado). Isso é realmente muito fácil ... aqui, por exemplo, é , para o tamanho da amostra a 14, usando o Mathematica :n4E[X(1)]n=1

 sol = Table[NIntegrate[x g, {x, -Infinity, Infinity}], {n, 1, 14}]

{0., -0.56419, -0.846284, -1.02938, -1.16296, -1.26721, -1.35218, -1.4236, -1.48501, -1.53875, -1.58644, -1.62923, -1.66799, -1.70338}

Tudo feito. Esses valores são obviamente muito diferentes dos da sua tabela (coluna da direita).

Para considerar o caso mais geral de um pai , proceda exatamente como acima, começando com o pdf normal geral.N(μ,σ2)

wolfies
fonte
Obrigado pela resposta. De fato, percebi que algo está errado com os resultados numéricos - afinal, o valor esperado deve aumentar em tamanho absoluto, em vez de diminuir, à medida que aumenta. Eu deixei a resposta como está, para ver se eu poderia obter algum insight de qualquer resposta. Eu ainda estou pesquisando no nível teórico onde exatamente está o erro, o suspeito sendo a primeira equação que eu uso de Owen (porque a segunda foi verificada por outras fontes) ... a propósito, você poderia verificar se essa eq em minha postagem (como uma transformação autônoma) está correta? Eu ficaria grato. 4n4
Alecos Papadopoulos