Que um pedaço de comprimento 1 seja quebrado em fragmentos uniformemente aleatoriamente. Qual é a distribuição do comprimento do fragmento mais longo?
Mais formalmente, sejam IID e sejam as estatísticas de pedidos associadas, ou seja , simplesmente solicitamos a amostra de maneira que . Deixe .
Estou interessado na distribuição do . Momentos, resultados assintóticos ou aproximações para também são interessantes.
Respostas:
Com as informações fornecidas por @Glen_b eu pude encontrar a resposta. Usando as mesmas notações da pergunta
onde se e caso contrário. Dou também a expectativa e a convergência assintótica ao Gumbel ( NB :a+=a a>0 0 distribuição de não Beta)
O material das provas é retirado de várias publicações vinculadas nas referências. Eles são um pouco longos, mas diretos.
1. Prova da distribuição exata
Seja as variáveis aleatórias uniformes do no intervalo . Ao solicitá-los, obtemos as estatísticas de ordens indicadas . Os espaçamentos uniformes são definidos como , com e . Os espaçamentos ordenados são as estatísticas ordenadas correspondentes . A variável de interesse é .(U1,…,Uk) (0,1) k (U(1),…,U(k)) Δi=U(i)−U(i−1) U(0)=0 U(k+1)=1 Δ(1)≤…≤Δ(k+1) Δ(k+1)
Para fixo , definimos a variável indicadora . Por simetria, o vetor aleatório é permutável, portanto, a distribuição conjunta de um subconjunto de tamanho é igual à distribuição conjunta de o primeirox∈(0,1) 1i=1{Δi>x} (11,…,1k+1) j j . Expandindo o produto, obtemos assim
Agora provaremos que , que estabelecerá a distribuição fornecida acima. Provamos isso para , como o caso geral é provado de maneira semelhante.E(∏ji=11i)=(1−jx)k+ j=2
Se , os pontos de interrupção estão no intervalo . Condicionalmente nesse evento, os pontos de interrupção ainda são intercambiáveis, portanto, a probabilidade de que a distância entre o segundo e o primeiro ponto de interrupção seja maior que é igual à probabilidade de que a distância entre o primeiro ponto de interrupção e a barreira esquerda (na posição ) é maior queΔ1>x k (x,1) x x x . tão
2. Expectativa
Para distribuições com suporte finito, temos
Integrando a distribuição de , obtemosΔ(k+1)
A última igualdade é uma representação clássica de números harmônicos , que demonstramos abaixo.Hi=1+12+…+1i
Com a mudança da variável e a expansão do produto, obtemosu=1−x
3. Construção alternativa de espaçamentos uniformes
Para obter a distribuição assintótica do maior fragmento, precisaremos exibir uma construção clássica de espaçamentos uniformes como variáveis exponenciais divididas por sua soma. A densidade de probabilidade das estatísticas de pedidos associadas(U(1),…,U(k)) é
Se denotar os espaçamentos uniformes , com , obteremosΔi=U(i)−U(i−1) U(0)=0
Ao definir , obtemos assimU(k+1)=1
Agora, seja variáveis aleatórias exponenciais do com média 1 e seja . Com uma simples mudança de variável, podemos ver que(X1,…,Xk+1) S=X1+…+Xk+1
Defina , de modo que, por uma mudança de variável, obtenhamosYi=Xi/S
Integrando essa densidade em relação a , obtemos assims
Portanto, a distribuição conjunta de espaçamentos uniformes no intervalo é a mesma que a distribuição conjunta dek+1 (0,1) k+1 variáveis aleatórias exponenciais divididas por sua soma. Chegamos à seguinte equivalência de distribuição
4. Distribuição assintótica
Utilizando a equivalência acima, obtemos
onde . Essa variável desaparece em probabilidade porque e . Assintoticamente, a distribuição é a mesma de . Como o é IID, temosTk+1=X1+…+Xk+1k+1−1 E(Tk+1)=0 Var(log(k+1)Tk+1)=(log(k+1))2k+1↓0 X(k+1)−log(k+1) Xi
5. Visão geral gráfica
O gráfico abaixo mostra a distribuição do maior fragmento para diferentes valores de . Para , também cobri a distribuição assintótica de Gumbel (linha fina). O Gumbel é uma péssima aproximação para valores pequenos de então eu os omito para não sobrecarregar a imagem. A aproximação de Gumbel é boa a partir de .k k=10,20,50 k k≈50
6. Referências
As provas acima são extraídas das referências 2 e 3. A literatura citada contém muitos outros resultados, como a distribuição dos espaçamentos ordenados de qualquer categoria, sua distribuição limite e algumas construções alternativas dos espaçamentos uniformes ordenados. As principais referências não são facilmente acessíveis, por isso também forneço links para o texto completo.
fonte
Esta não é uma resposta completa, mas fiz algumas simulações rápidas e foi isso que obtive:
Isso parece notavelmente beta-ish, e isso faz um pouco de sentido, já que as estatísticas de ordem das distribuições uniformes do iid são beta wiki .
Isso pode dar um ponto de partida para derivar o pdf resultante.
Vou atualizar se chegar a uma solução final fechada.
Felicidades!
fonte
Eu produzi a resposta para uma conferência em Siena (Itália) em 2005. O artigo (2006) é apresentado no meu site aqui (pdf) . As distribuições exatas de todos os espaçamentos (do menor para o maior) são encontradas nas páginas 75 e 76.
Espero fazer uma apresentação sobre esse tópico na Conferência RSS em Manchester (Inglaterra) em setembro de 2016.
fonte