Classes de distribuições fechadas sob o máximo

11

Seja Qp uma classe de distribuições de probabilidade em reais não negativos parametrizados por p , de modo que

Qp([0,))=1.
Gostaria de saber quais classes de distribuição conhecidas são fechadas sob o máximo e, por exemplo, se X1Qp1 e X2Qp2 são independentes, em seguida, max(X1,X2)Qp3 .
Ilya
fonte
2
Você está procurando uma caracterização matemática de tais classes ou está perguntando sobre quais das famílias paramétricas de distribuição geralmente conhecidas podem ter essa propriedade?
whuber
@whuber Todos os três tipos de valores extremos funcionam de acordo com o argumento que forneci abaixo. Eu não mostro que eles são os únicos.
Michael R. Chernick
O ponto de poder de Stoev que whuber cita mostra o resultado que eu dei para essas distribuições que llya descreveu que são chamadas de maxi-estável e o teorema citado na apresentação afirma ainda que elas são as únicas.
Michael R. Chernick 16/05
@ Michael Você notou a restrição a valores não negativos na pergunta? Isso exclui as distribuições de valor extremo com suporte positivo nos reais negativos.
whuber

Respostas:

12

Parece-me que propor distribuições de valor extremo realmente responde a uma pergunta diferente. Vou demonstrar que, ao abordar essa questão diretamente e mostrar que ela leva a distribuições que não estão entre os tipos de valores extremos.

Vamos considerar isso a partir dos primeiros princípios. É imediato, a partir dos axiomas de probabilidade e definição do CDF, que a distribuição do máximo de duas variáveis ​​aleatórias independentes com os CDFs e tem para seu CDF. Suponha que exista uma classe de distribuições fechada abaixo do máximo em pares; isso é,F 2 F 1 F 2 Ω = { F θ }F1F2F1F2Ω={Fθ}

FθΩ, FϕΩ implica FθFϕΩ.

É conveniente usar logaritmos, estendendo (como nos textos de análise avançada de Rudin) os números reais para incluir como o log de . Logs de CDFs de variáveis ​​aleatórias essencialmente suportadas em são (i) mononoticamente não crescentes, (ii) iguais a em , (iii) têm limites corretos de e ( iv) são cadlag. Desse ponto de vista, deve ser um subconjunto convexo de um cone no espaço das funções cadlag em . Para que seja parametrizado finitamente, esse cone deve gerar um subespaço vetorial de dimensão finita. Isso ainda deixa muitas possibilidades.0 [ 0 , ) - ( - , 0 ) 0 Ω R-0 0[0 0,)-(,0)0ΩR

Algumas dessas possibilidades são bem conhecidas. Considere, por exemplo, o CDF de uma variável uniforme em . Seu CDF é igual a em , quando e em . O cone que gera é o conjunto de CDFs do formulário0 ( - , 0 ] x 0 x 1 1 [ 1 , )[0,1]0(,0]x0x11[1,)

Fθ(x)=exp(θregistro(x))=xθ,0 0<x<1

parametrizado por . Claramente, o máximo de duas variáveis ​​aleatórias independentes com distribuições nessa família também tem uma distribuição nessa família (seus parâmetros simplesmente acrescentam). Podemos, se desejar, restringir a um subconjunto convexo do formato e ainda tem uma família fechada no máximo. Observe, por favor, que nenhum membro desta família é uma distribuição de valor extremo.{ F θ | θ θ 0 }θ>0 0{Fθ|θθ0}

Essa formulação inclui distribuições discretas (que obviamente não estão entre os três tipos de distribuição de valor extremo). Por exemplo, considere as distribuições suportadas nos números naturais para os quais as probabilidades são dadas por0,1,2,,k,

Prθ(k)=θ1/(k+1)θ1/k

(tomando quando ), parametrizado por . Por construção, o CDF , de onde seguek = 0 0 < θ < 1 F θ ( k ) = θ 1 / ( k + 1 )θ1/k=0k=00<θ<1Fθ(k)=θ1/(k+1)

Fθ(k)Fϕ(k)=θ1/(k+1)ϕ1/(k+1)=(θϕ)1/(k+1),

e como as premissas implicam , isso mostra que a família está fechada sob o máximo de pares.0<θϕ<1

Espero que essa análise e esses dois exemplos mostrem que, ao contrário de uma opinião expressa em um comentário, a abordagem de começar com um número finito de CDFs bem escolhidas e fechá-las em relação ao máximo pareado (ou seja, formar seus cones em um espaço vetorial relacionado apropriado) não apenas é construtivo, mas gera classes de distribuição interessantes e potencialmente úteis.

whuber
fonte
3
+1 para esta análise e verificação da interpretação de distribuições de valor extremo.
1
@ whuber: muito obrigado pela atenção prestada a esse problema, eu realmente não esperava muitas respostas legais (e vou cumprimentar todos que responderam). A construção de cone (ou semigrupo) que você forneceu é realmente verdadeira: se for qualquer família de distribuições, seu fechamento (wrt ) todos os elementos do formulário onde e . Infelizmente, percebi que o fechamento wrt shift também é necessário (ou seja, se seguida, ). Devo fazer uma nova pergunta para isso? max ( F α 1 θ 1 × × F α n θ n ) α i0 n N F ( x ) Ω F ( x - a ) ΩFθmax(Fθ1α1××Fθnαn)αi0nNF(x)ΩF(xa)Ω
Ilya
1
Isso é certamente uma complicação, Ilya. Porém, antes de alterar qualquer coisa ou publicar uma nova pergunta, considere como reconciliaria o requisito de fechamento de turno com o requisito (aparentemente contraditório) de que todas as variáveis ​​tenham suporte não negativo! (Eu acho que você precisará restringir os possíveis valores de ).a
whuber
Não está relacionado a essa questão, mas procura exemplos de famílias estáveis ​​sob o produto.
Vincent Granville
1
@Vincent Para começar, considere qualquer família de variáveis ​​aleatórias fechadas de maneira aditiva e exponencie-as. Para uma família mais rica, multiplique qualquer uma dessas variáveis ​​por uma variável independente Rademacher (obtendo variáveis ​​suportadas em toda a linha real, em vez de apenas os números positivos). U
whuber
10

Nota: Esta resposta assume que as variáveis ​​são distribuídas de forma idêntica , não apenas distribuídas de acordo com a mesma classe.

Essas seriam as distribuições de valor extremo . Existem três deles, como geralmente são apresentados, correspondendo a três conjuntos de condições na distribuição subjacente para a qual a distribuição limite do máximo está sendo encontrada. Eles são fechados para encontrar o máximo, que é o que você deseja.

Cópia mais ou menos de uma versão antiga dos Métodos de Análise Estatística para Dados de Confiabilidade e Vida (Mann, Schafer, Singpurwalla),

Tipo I: FX(n)(x)=exp{exp[xγα]}, <x<, α>0

Tipo II: FX(n)(x)=exp{(xγα)β}, xγ, α,β>0

Tipo III: FX(n)(x)=exp{[(xγα)β]}. xγ, α,β>0

Editar: Leia os comentários, que estendem esta resposta para fazer uma resposta muito melhorada e mais completa a esta pergunta!

jbowman
fonte
3
+1 Mas os tipos I e III não se aplicam à pergunta.
whuber
Bastante verdadeiro (+1), eu estava respondendo a uma pergunta mais geral sem explicar a diferença. Além disso, eu deveria ter descrito a normalização que deve ocorrer para evitar a degeneração, como você fez no seu comentário à resposta do MC abaixo. Ensine-me a escrever essas respostas quando estiver prestes a sair pela porta! (bem, talvez não ... :)
jbowman
1
@whuber Eu provavelmente estou perguntando algo óbvio, mas é verdade que, se e e eles são independentes, então ? X 2F r e c h e t ( α 2 , β 2 )X1Frechet(α1,β1)X2Frechet(α2,β2)max(X1,X2)Frechet(α3,β3)
2
Essa é uma ótima pergunta, @Procrastinator. Como não consegui pensar em nenhuma razão para que esse resultado fosse verdadeiro, simulei 1.000.000 valores de ID de Frechet e 1.000.000 de valores de ID de Frechet e calculei seus máximos aos pares. Os resultados não podem ser ajustados - nem mesmo aproximadamente - por qualquer distribuição Frechet . Você precisa dos três parâmetros (incluindo o parâmetro de localização) para fechar esta família no máximo. Então - emulando um argumento (incompleto) na resposta de Michael Chernick - você pode mostrar que deve ser deslocado com Frechet em escala. ( 10 , 1 ) ( α , β ) máx ( X 1 , X 2 )(3,1)(10,1)(α,β)max(X1,X2)
whuber
Esta resposta está incorreta. O teorema do valor extremo se aplica quando as distribuições das variáveis ​​são idênticas , mas a pergunta diz que elas só devem pertencer à mesma classe (elas podem ter parâmetros diferentes).
user76284
0

Jbowman me bateu na resposta. Uma explicação do porquê eles funcionam é que o Teorema de Gnedenko afirma que se é uma sequência de variáveis ​​aleatórias independentes distribuídas de forma idêntica sob certas condições na cauda de a distribuição converge para um dos três tipos listados por jbowman em sua resposta. Agora, como qualquer distribuição do tipo I, tipo II ou III pode ser expressa como o limite máximo de uma sequência iid, se é o tipo I e é a distribuição limite de como tende ao infinito e também é do tipo I e é o limite deX1,,XnnMn=max(X1,X2,,Xn)G1Mn=max(X1,X2,,Xn)nG2Nn=max(Y1,Y2,dotsc,Yn)então diga e é a distribuição do limite conforme aproxima do infinito para então será do tipo I e será a distribuição para o máximo de um rv com a distribuição e outro com a distribuição e portanto, o tipo I é fechado sob maximização. O mesmo argumento funciona para os tipos II e III.Vn=max(Mn,Nn)G3nVnG3G1G2

Michael R. Chernick
fonte
2
Para as distribuições ilimitadas, o máximo não converge: diverge com . Como no CLT, é necessária uma normalização apropriada. (É por isso que é essencial incluir parâmetros de localização e escala nessas famílias.) O artigo clássico de Gnedenko sobre o assunto começa (se bem me lembro) perguntando se uma série de coeficientes afins pode ser encontrada de modo que converge. Depois de estabelecer isso, ele obtém as formas possíveis de distribuição limitadora. a n , b n a M n + b nnan,bnaMn+bn
whuber
Em todos os casos, eu deveria ter dito adequadamente normalizado. Obrigado. Mesmo no caso limitado que você tem para normalizar para obter o limite (eu penso, devo lembrar disso, minha dissertação foi sobre extremos Mas há 34 anos!)
Michael R. Chernick
3
Observe também que as distribuições de valor extremo não respondem exaustivamente à pergunta. (Isso não é crítica, é apenas uma observação.) Por exemplo, restringindo aos números naturais, podemos definir Q p como a distribuição uniforme em [ p , p + 1 ] . Esta classe é fechada abaixo do valor máximo ( max ( Q p , Q r ) Q max ( p , r ) ), mas nenhum membro dela é uma distribuição de valor extremo. pQp[p,p+1]max(Qp,Qr)Qmax(p,r)
whuber
@whuber todos os três tipos são casos ilimitados, mas o tipo III de cauda curta inclui casos limitados, como a distribuição uniforme. Para U [0,1], P [Mn <= 1-x / n] converge para exp (-x), pois P [Mn <= 1-x / n] = (1-x / n) ^ n.
Michael R. Chernick
3
Suas respostas não parecem relevantes no exemplo que dei, Michael. A distinção é que esta pergunta não está perguntando sobre sequências contáveis ​​de variáveis ​​iid ou mesmo sequências contáveis ​​de qualquer coisa; está perguntando apenas sobre o fechamento sob pares de variáveis ​​que normalmente têm distribuições diferentes . (Mas agora vejo que há uma falha no meu exemplo: o máximo quando não é mais uniforme, então eu teria que aumentar a família adequadamente para incluir o máximo de arbitrariamente muitos uniformes de p=r
identificação