Existem fórmulas bem conhecidas para as estatísticas de ordem de determinadas distribuições aleatórias? Particularmente as estatísticas de primeira e última ordem de uma variável aleatória normal, mas uma resposta mais geral também seria apreciada.
Editar: para esclarecer, estou procurando por fórmulas aproximadas que possam ser avaliadas mais ou menos explicitamente, e não a expressão integral exata.
Por exemplo, eu vi as duas aproximações a seguir para a estatística de primeira ordem (ou seja, o mínimo) de um rv normal:
e
O primeiro deles, para , fornece aproximadamente que parece um limite descontrolado.
O segundo fornece enquanto um Monte Carlo rápido fornece ; portanto, não é uma aproximação ruim, mas também não é ótima, e Mais importante ainda, não tenho nenhuma intuição sobre de onde vem.
Qualquer ajuda?
fonte
Respostas:
A referência clássica é Royston (1982) [1], que possui algoritmos que vão além de fórmulas explícitas. Também cita uma fórmula bem conhecida de Blom (1958): com . Esta fórmula fornece um multiplicador de -2,73 para .α=0,375n=200,r=1E(r:n)≈μ+Φ−1(r−αn−2α+1)σ α=0.375 n=200,r=1
[1]: Algoritmo AS 177: Estatísticas esperadas de ordem normal (exata e aproximada) JP Royston. Jornal da Sociedade Estatística Real. Série C (Estatística Aplicada), vol. 31, n. 2 (1982), pp. 161-165
fonte
Existem maneiras de fazer essa escolha, portanto, temos:(N1)(N−1i−1)
EDIT no meu post original, fiz uma péssima tentativa de ir além deste ponto, e os comentários abaixo refletem isso. Eu tentei corrigir isso abaixo
Se considerarmos o valor médio deste pdf, obtemos:
E nesta integral, fazemos a seguinte alteração da variável (usando a dica de @ henry), e a integral se torna:pi=FX(xi)
Portanto, este é o valor esperado do CDF inverso, que pode ser bem aproximado usando o método delta para fornecer:
Para fazer uma melhor aproximação, podemos expandir para a 2ª ordem (diferenciação denotativa primária) e notar que a segunda derivada de uma inversa é:
Deixe . Então nós temos:νi=F−1X[iN+1]
=νi-(i
Agora, especializando-se no caso normal, temos FX(x)=Φ(x-μ
Observe que E a expectativa se torna aproximadamente:fX(νi)=1σϕ[Φ−1(iN+1)]
E finalmente:
Embora, como o @whuber notou, isso não será preciso nas caudas. Na verdade, acho que pode ser pior, devido à distorção de uma versão beta com parâmetros diferentes
fonte
A resposta de Aniko se baseia na fórmula bem conhecida de Blom, que envolve uma escolha de . Acontece que esta fórmula é, em si mesma, uma mera aproximação de uma resposta exata devido a G. Elfving (1947), A distribuição assintótica do intervalo em amostras de uma população normal , Biometrika, vol. 34, pp. 111-119. A fórmula de Elfving visa o mínimo e o máximo da amostra, para os quais a escolha correta de alfa é . A fórmula de Blom resulta quando aproximamos por .α=3/8 π/8 π 3
Usando a fórmula Elfving em vez da aproximação de Blom, obtemos um multiplicador de -2,744165. Esse número está mais próximo da resposta exata de Erik P. (-2,746) e da aproximação de Monte Carlo (-2,75) do que a aproximação de Blom (-2,73), sendo mais fácil de implementar do que a fórmula exata.
fonte
Dependendo do que você deseja fazer, esta resposta pode ou não ajudar - eu obtive a fórmula exata a seguir do pacote Statistics da Maple .
Por si só, isso não é muito útil (e provavelmente poderia ser derivado facilmente com a mão, pois é o mínimo de variáveis aleatórias), mas permite uma aproximação rápida e muito precisa de determinados valores de - muito mais preciso do que Monte Carlo:nn n
fornece -2,746042447 e -2,746042447451154492412344, respectivamente.
(Divulgação completa - mantenho este pacote.)
fonte