Uma maneira indireta é a seguinte:
Para distribuições absolutamente contínuas, Richard von Mises (em um artigo de 1936 "A distribuição da maior quantidade de valores" , que parece ter sido reproduzido em inglês? - em uma edição de 1964 com documentos), forneceu as seguintes condições suficientes para que o máximo de uma amostra converja para o padrão Gumbel, :G(x)
Seja a função de distribuição comum de n iid variáveis aleatórias ef ( x ) sua densidade comum. Então seF(x)nf(x)
limx→F−1(1)(ddx(1−F(x))f(x))=0⇒X(n)→dG(x)
Usando a notação usual para o normal normal e calculando a derivada, temos
ddx(1−Φ(x))ϕ(x)=−ϕ(x)2−ϕ′(x)(1−Φ(x))ϕ(x)2=−ϕ′(x)ϕ(x)(1−Φ(x))ϕ(x)−1
Observe que . Além disso, para a distribuição normal,F-1(1)=∞. Então nós temos que avaliar o limite−ϕ′(x)ϕ(x)=xF−1(1)=∞
limx→∞(x(1−Φ(x))ϕ(x)−1)
Mas é a razão de Mill, e sabemos que a razão de Mill para o padrão normal tende a1/x àmedida quexcresce. então(1−Φ(x))ϕ(x)1/xx
limx → ∞( x ( 1 - Φ ( x ) )ϕ ( x )- 1 ) = x 1x- 1 = 0
e a condição suficiente é satisfeita.
Os série associados são dadas como
uman= 1n ϕ ( bn),bn= Φ- 1( 1 - 1 / n )
TERMO ADITIVO
Isto é do cap. 10.5 do livro HA David & HN Nagaraja (2003), "Order Statistics" (edição 3d) .
. Além disso, a referência a de Haan é"Haan, LD (1976). Exemplos extremos: uma introdução elementar. Statistica Neerlandica, 30 (4), 161-172." Mas cuidado, porque parte da notação tem conteúdo diferente emde Haan- por exemplo, no livro f ( t ) é a função de densidade de probabilidade, enquanto emde Haan f ( t ) significa a função w ( t ) do livro (isto é, a razão de Mill). De Haan também examina a condição suficiente já diferenciada.ξuma= F- 1( Um )f(t) f(t)w(t)
A pergunta faz duas coisas: (1) como mostrar que o máximo de converge, no sentido de que ( X ( n ) - b n ) / a n converge (em distribuição) para seqüências adequadamente escolhidas ( a n ) e ( b n ) , à distribuição Standard Gumbel e (2) como encontrar tais seqüências.X(n) (X(n)−bn)/an (an) (bn)
O primeiro é bem conhecido e documentado nos trabalhos originais sobre o teorema de Fisher-Tippett-Gnedenko (FTG). O segundo parece ser mais difícil; esse é o problema abordado aqui.
Observe, para esclarecer algumas afirmações que aparecem em outras partes deste tópico, que
O máximo não converge para nada: diverge (ainda que extremamente devagar).
Parece haver diferentes convenções sobre a distribuição Gumbel. Adotarei a convenção de que o CDF de uma distribuição reversa de Gumbel é, de acordo com a escala e a localização, dado por . Um máximo padronizado de variáveis normais normais converge para uma distribuição Gumbel invertida.1−exp(−exp(x))
Intuição
Quando o são iid com função de distribuição comum F , a distribuição do máximo X ( n ) éXi F X(n)
Quando o suporte de não tem limite superior, como na distribuição Normal, a sequência de funções F n marcha para sempre para a direita, sem limite:F Fn
Gráficos parciais de para n = 1 , 2 , 2 2 , 2 4 , 2 8 , 2 16 são mostrados.Fn n=1,2,22,24,28,216
Para estudar as formas dessas distribuições, podemos mudar cada um de volta para a esquerda por uma certa quantidade e redimensionar-lo por um n para torná-los comparáveis.bn an
Cada um dos gráficos anteriores foi deslocado para colocar sua mediana em e fazer seu intervalo interquartil de comprimento unitário.0
O FTG afirma que as seqüências e ( b n ) podem ser escolhidas para que essas funções de distribuição converjam ponto a ponto a cada x para uma distribuição de valor extremo , até a escala e a localização. Quando F é uma distribuição Normal, a distribuição de valor extremo limitante específica é um Gumbel invertido, até o local e a escala.(an) (bn) x F
Solução
Portanto, podemos definir
funcionará bem (e é o mais simples possível).
Referências
BV Gnedenko, sobre a distribuição limitante do prazo máximo em uma série aleatória . Em Kotz e Johnson, Breakthroughs in Statistics Volume I: Foundations and Basic Theory, Springer, 1992. Traduzido por Norman Johnson.
fonte