Seja uma classe de distribuições de probabilidade em reais não negativos parametrizados por , de modo que
Gostaria de saber quais classes de distribuição conhecidas são fechadas sob o máximo e, por exemplo, se e são independentes, em seguida, .
distributions
Ilya
fonte
fonte
Respostas:
Parece-me que propor distribuições de valor extremo realmente responde a uma pergunta diferente. Vou demonstrar que, ao abordar essa questão diretamente e mostrar que ela leva a distribuições que não estão entre os tipos de valores extremos.
Vamos considerar isso a partir dos primeiros princípios. É imediato, a partir dos axiomas de probabilidade e definição do CDF, que a distribuição do máximo de duas variáveis aleatórias independentes com os CDFs e tem para seu CDF. Suponha que exista uma classe de distribuições fechada abaixo do máximo em pares; isso é,F 2 F 1 F 2 Ω = { F θ }F1 F2 F1F2 Ω = { Fθ}
É conveniente usar logaritmos, estendendo (como nos textos de análise avançada de Rudin) os números reais para incluir como o log de . Logs de CDFs de variáveis aleatórias essencialmente suportadas em são (i) mononoticamente não crescentes, (ii) iguais a em , (iii) têm limites corretos de e ( iv) são cadlag. Desse ponto de vista, deve ser um subconjunto convexo de um cone no espaço das funções cadlag em . Para que seja parametrizado finitamente, esse cone deve gerar um subespaço vetorial de dimensão finita. Isso ainda deixa muitas possibilidades.0 [ 0 , ∞ ) - ∞ ( - ∞ , 0 ) 0 Ω R- ∞ 0 0 [ 0 , ∞ ) - ∞ (−∞,0) 0 Ω R
Algumas dessas possibilidades são bem conhecidas. Considere, por exemplo, o CDF de uma variável uniforme em . Seu CDF é igual a em , quando e em . O cone que gera é o conjunto de CDFs do formulário0 ( - ∞ , 0 ] x 0 ≤ x ≤ 1 1 [ 1 , ∞ )[0,1] 0 (−∞,0] x 0≤x≤1 1 [ 1 , ∞ )
parametrizado por . Claramente, o máximo de duas variáveis aleatórias independentes com distribuições nessa família também tem uma distribuição nessa família (seus parâmetros simplesmente acrescentam). Podemos, se desejar, restringir a um subconjunto convexo do formato e ainda tem uma família fechada no máximo. Observe, por favor, que nenhum membro desta família é uma distribuição de valor extremo.{ F θ | θ ≥ θ 0 }θ > 0 { Fθ|θ≥θ0}
Essa formulação inclui distribuições discretas (que obviamente não estão entre os três tipos de distribuição de valor extremo). Por exemplo, considere as distribuições suportadas nos números naturais para os quais as probabilidades são dadas por0,1,2,…,k,…
(tomando quando ), parametrizado por . Por construção, o CDF , de onde seguek = 0 0 < θ < 1 F θ ( k ) = θ 1 / ( k + 1 )θ1/k=0 k=0 0<θ<1 Fθ(k)=θ1/(k+1)
e como as premissas implicam , isso mostra que a família está fechada sob o máximo de pares.0<θϕ<1
Espero que essa análise e esses dois exemplos mostrem que, ao contrário de uma opinião expressa em um comentário, a abordagem de começar com um número finito de CDFs bem escolhidas e fechá-las em relação ao máximo pareado (ou seja, formar seus cones em um espaço vetorial relacionado apropriado) não apenas é construtivo, mas gera classes de distribuição interessantes e potencialmente úteis.
fonte
Nota: Esta resposta assume que as variáveis são distribuídas de forma idêntica , não apenas distribuídas de acordo com a mesma classe.
Essas seriam as distribuições de valor extremo . Existem três deles, como geralmente são apresentados, correspondendo a três conjuntos de condições na distribuição subjacente para a qual a distribuição limite do máximo está sendo encontrada. Eles são fechados para encontrar o máximo, que é o que você deseja.
Cópia mais ou menos de uma versão antiga dos Métodos de Análise Estatística para Dados de Confiabilidade e Vida (Mann, Schafer, Singpurwalla),
Tipo I:FX(n)(x)=exp{−exp[−x−γα]}, −∞<x<∞, α>0
Tipo II:FX(n)(x)=exp{−(x−γα)−β}, x≥γ, α,β>0
Tipo III:FX(n)(x)=exp{−[−(x−γα)β]}. x≤γ, α,β>0
Editar: Leia os comentários, que estendem esta resposta para fazer uma resposta muito melhorada e mais completa a esta pergunta!
fonte
Jbowman me bateu na resposta. Uma explicação do porquê eles funcionam é que o Teorema de Gnedenko afirma que se é uma sequência de variáveis aleatórias independentes distribuídas de forma idêntica sob certas condições na cauda de a distribuição converge para um dos três tipos listados por jbowman em sua resposta. Agora, como qualquer distribuição do tipo I, tipo II ou III pode ser expressa como o limite máximo de uma sequência iid, se é o tipo I e é a distribuição limite de como tende ao infinito e também é do tipo I e é o limite deX1,…,Xn n Mn=max(X1,X2,…,Xn) G1 Mn=max(X1,X2,…,Xn) n G2 Nn=max(Y1,Y2,dotsc,Yn) então diga e é a distribuição do limite conforme aproxima do infinito para então será do tipo I e será a distribuição para o máximo de um rv com a distribuição e outro com a distribuição e portanto, o tipo I é fechado sob maximização. O mesmo argumento funciona para os tipos II e III.Vn=max(Mn,Nn) G3 n Vn G3 G1 G2
fonte