Distribuição do maior fragmento de uma vara quebrada (espaçamentos)

21

Que um pedaço de comprimento 1 seja quebrado em fragmentos uniformemente aleatoriamente. Qual é a distribuição do comprimento do fragmento mais longo?k+1

Mais formalmente, sejam IID e sejam as estatísticas de pedidos associadas, ou seja , simplesmente solicitamos a amostra de maneira que . Deixe .(U1,Uk)U(0,1)(U(1),,U(k))U(1)U(2),,U(k)Zk=max(U(1),U(2)U(1),,U(k)U(k1),1U(k))

Estou interessado na distribuição do Zk . Momentos, resultados assintóticos ou aproximações para k também são interessantes.

gui11aume
fonte
9
Este é um problema bem estudado; ver R. Pyke (1965), "Spacings", JRSS (B) 27 : 3, pp. 395-449. Tentarei voltar para adicionar algumas informações mais tarde, a menos que alguém me derrote. Também há um artigo de 1972 do mesmo autor (" Spacings revisited "), mas acho que o que você procura é basicamente o primeiro. Há alguns assintóticos em Devroye (1981) , "Leis do logaritmo iterado para estatísticas de ordem de espaçamentos uniformes" Ann. Probab. , 9 : 5, 860-867.
Glen_b -Reinstate Monica
4
Eles também devem fornecer bons termos de pesquisa para encontrar trabalhos posteriores, se você precisar.
Glen_b -Reinstate Monica
3
Isso é incrível. A primeira referência é difícil de encontrar. Para os interessados, coloquei no Grand Locus .
gui11aume
Corrija a impressão incorreta: vez de . Y(k)U(k)
Viktor
Obrigado @Viktor! Para coisas tão pequenas, não hesite em fazer a edição você mesmo (acho que ela será revisada por outros usuários para aprovação).
precisa saber é o seguinte

Respostas:

18

Com as informações fornecidas por @Glen_b eu pude encontrar a resposta. Usando as mesmas notações da pergunta

P(Zkx)=j=0k+1(k+1j)(1)j(1jx)+k,

onde se e caso contrário. Dou também a expectativa e a convergência assintótica ao Gumbel ( NB :a+=aa>00 distribuição de não Beta)

E(Zk)=1k+1i=1k+11ilog(k+1)k+1,P(Zkx)exp(e(k+1)x+log(k+1)).

O material das provas é retirado de várias publicações vinculadas nas referências. Eles são um pouco longos, mas diretos.

1. Prova da distribuição exata

Seja as variáveis ​​aleatórias uniformes do no intervalo . Ao solicitá-los, obtemos as estatísticas de ordens indicadas . Os espaçamentos uniformes são definidos como , com e . Os espaçamentos ordenados são as estatísticas ordenadas correspondentes . A variável de interesse é .(U1,,Uk)(0,1)k(U(1),,U(k))Δi=U(i)U(i1)U(0)=0U(k+1)=1Δ(1)Δ(k+1)Δ(k+1)

Para fixo , definimos a variável indicadora . Por simetria, o vetor aleatório é permutável, portanto, a distribuição conjunta de um subconjunto de tamanho é igual à distribuição conjunta de o primeirox(0,1)1i=1{Δi>x}(11,,1k+1)jj . Expandindo o produto, obtemos assim

P(Δ(k+1)x)=E(i=1k+1(11i))=1+j=1k+1(k+1j)(1)jE(i=1j1i).

Agora provaremos que , que estabelecerá a distribuição fornecida acima. Provamos isso para , como o caso geral é provado de maneira semelhante.E(i=1j1i)=(1jx)+kj=2

E(i=121i)=P(Δ1>xΔ2>x)=P(Δ1>x)P(Δ2>x|Δ1>x).

Se , os pontos de interrupção estão no intervalo . Condicionalmente nesse evento, os pontos de interrupção ainda são intercambiáveis, portanto, a probabilidade de que a distância entre o segundo e o primeiro ponto de interrupção seja maior que é igual à probabilidade de que a distância entre o primeiro ponto de interrupção e a barreira esquerda (na posição ) é maior queΔ1>xk(x,1)xxx . tão

P(Δ2>x|Δ1>x)=P(all points are in (2x,1)|all points are in (x,1)),soP(Δ2>xΔ1>x)=P(all points are in (2x,1))=(12x)+k.

2. Expectativa

Para distribuições com suporte finito, temos

E(X)=P(X>x)dx=1P(Xx)dx.

Integrando a distribuição de , obtemosΔ(k+1)

E(Δ(k+1))=1k+1j=1k+1(k+1j)(1)j+1j=1k+1j=1k+11j.

A última igualdade é uma representação clássica de números harmônicos , que demonstramos abaixo.Hi=1+12++1i

Hk+1=011+x++xkdx=011xk+11xdx.

Com a mudança da variável e a expansão do produto, obtemosu=1x

Hk+1=01j=1k+1(k+1j)(1)j+1uj1du=j=1k+1(k+1j)(1)j+1j.

3. Construção alternativa de espaçamentos uniformes

Para obter a distribuição assintótica do maior fragmento, precisaremos exibir uma construção clássica de espaçamentos uniformes como variáveis ​​exponenciais divididas por sua soma. A densidade de probabilidade das estatísticas de pedidos associadas (U(1),,U(k)) é

fU(1),U(k)(u(1),,u(k))=k!,0u(1)u(k+1).

Se denotar os espaçamentos uniformes , com , obteremosΔi=U(i)U(i1)U(0)=0

fΔ1,Δk(δ1,,δk)=k!,0δi++δk1.

Ao definir , obtemos assimU(k+1)=1

fΔ1,Δk+1(δ1,,δk+1)=k!,δ1++δk=1.

Agora, seja variáveis ​​aleatórias exponenciais do com média 1 e seja . Com uma simples mudança de variável, podemos ver que(X1,,Xk+1)S=X1++Xk+1

fX1,Xk,S(x1,,xk,s)=es.

Defina , de modo que, por uma mudança de variável, obtenhamosYi=Xi/S

fY1,Yk,S(y1,,yk,s)=skes.

Integrando essa densidade em relação a , obtemos assims

fY1,Yk,(y1,,yk)=0skesds=k!,0yi++yk1,and thusfY1,Yk+1,(y1,,yk+1)=k!,y1++yk+1=1.

Portanto, a distribuição conjunta de espaçamentos uniformes no intervalo é a mesma que a distribuição conjunta dek+1(0,1)k+1 variáveis ​​aleatórias exponenciais divididas por sua soma. Chegamos à seguinte equivalência de distribuição

Δ(k+1)X(k+1)X1++Xk+1.

4. Distribuição assintótica

Utilizando a equivalência acima, obtemos

P((k+1)Δ(k+1)log(k+1)x)=P(X(k+1)(x+log(k+1))X1++Xk+1k+1)=P(X(k+1)log(k+1)x+(x+log(k+1))Tk+1),

onde . Essa variável desaparece em probabilidade porque e . Assintoticamente, a distribuição é a mesma de . Como o é IID, temosTk+1=X1++Xk+1k+11E(Tk+1)=0Var(log(k+1)Tk+1)=(log(k+1))2k+10X(k+1)log(k+1)Xi

P(X(k+1)log(k+1)x)=P(X1x+log(k+1))k+1=(1exlog(k+1))k+1=(1exk+1)k+1exp{ex}.

5. Visão geral gráfica

O gráfico abaixo mostra a distribuição do maior fragmento para diferentes valores de . Para , também cobri a distribuição assintótica de Gumbel (linha fina). O Gumbel é uma péssima aproximação para valores pequenos de então eu os omito para não sobrecarregar a imagem. A aproximação de Gumbel é boa a partir de .kk=10,20,50kk50

Distribuição do maior fragmento de um pau quebrado

6. Referências

As provas acima são extraídas das referências 2 e 3. A literatura citada contém muitos outros resultados, como a distribuição dos espaçamentos ordenados de qualquer categoria, sua distribuição limite e algumas construções alternativas dos espaçamentos uniformes ordenados. As principais referências não são facilmente acessíveis, por isso também forneço links para o texto completo.

  1. Bairamov et al. (2010) Resultados de limite para espaçamentos uniformes ordenados , Stat papers, 51: 1, pp 227-240
  2. Holst (1980) Sobre os pedaços de um pedaço de pau quebrado ao acaso , J. Appl. Prob., 17, pp. 623-634
  3. Pyke (1965) Spacings , JRSS (B) 27: 3, pp. 395-449
  4. Renyi (1953) Sobre a teoria das estatísticas da ordem , Acta math Hung, 4, pp 191-231
gui11aume
fonte
Brilhante. A propósito, existe um assintótico conhecido para ? E(Zk2)
Amir Sagiv
@AmirSagiv, essa é uma boa pergunta. Dei uma rápida olhada nas referências e não consegui encontrá-las. Também não consegui adaptar a prova acima. Isso me fez perceber que não sei qual é a distribuição de um quadrado de um Gumbel. Talvez seja um bom lugar para começar?
precisa saber é
1
$ Olhe gui11aume aqui: mathoverflow.net/a/293381/42864
Amir Sagiv
1
@AmirSagiv Este é um post muito bom. Por alguma razão, eu entendi mal sua pergunta e pensei que você estava interessado na distribuição assintótica de (mesmo que seu comentário fosse muito claro), então meu comentário acima não é tão relevante. Zk2
gui11aume
3

Esta não é uma resposta completa, mas fiz algumas simulações rápidas e foi isso que obtive: Histograma do fragmento mais longo

Isso parece notavelmente beta-ish, e isso faz um pouco de sentido, já que as estatísticas de ordem das distribuições uniformes do iid são beta wiki .

Isso pode dar um ponto de partida para derivar o pdf resultante.

Vou atualizar se chegar a uma solução final fechada.

Felicidades!

Lima
fonte
Só mais uma coisa, a forma do histograma para aumentar k não muda consideravelmente, além de obter "esmagado" perto de 0.
Lima
1
Obrigado por seus pensamentos @Lima (e bem-vindo ao Cross Validated). Eu acho que sua resposta pode ser melhorada. Primeiro, eu evitaria fazer declarações sem provas. Se isso estiver incorreto, você pode colocar as pessoas que veem esse tópico no caminho errado. Segundo, eu documentaria o que você fez. Sem o valor de que você usou nem o código, a figura não ajuda ninguém. Por fim, copio e edito a resposta e removo tudo o que não está respondendo diretamente à pergunta. k
gui11aume
1
Obrigado pelas sugestões. Eles são válidos além da troca de pilhas e eu lembrarei de usá-los.
Lima
1

Eu produzi a resposta para uma conferência em Siena (Itália) em 2005. O artigo (2006) é apresentado no meu site aqui (pdf) . As distribuições exatas de todos os espaçamentos (do menor para o maior) são encontradas nas páginas 75 e 76.

Espero fazer uma apresentação sobre esse tópico na Conferência RSS em Manchester (Inglaterra) em setembro de 2016.

CJStephens
fonte
2
Bem vindo ao site. Estamos tentando construir um repositório permanente de informações estatísticas de alta qualidade na forma de perguntas e respostas. Portanto, temos receio de respostas somente para links, devido ao linkrot. Você pode postar uma citação completa e um resumo das informações no link, caso elas desapareçam? Além disso, não assine suas postagens aqui. Cada postagem tem um link para sua página de usuário, onde você pode postar essas informações.
gung - Restabelece Monica