Desenhar n intervalos uniformemente aleatoriamente, probabilidade de que pelo menos um intervalo se sobreponha a todos os outros

17

Desenhe aleatoriamente n intervalos de [0,1] , onde cada ponto final A, B é selecionado a partir da distribuição uniforme entre [0,1] .

Qual é a probabilidade de que pelo menos um intervalo se sobreponha a todos os outros?

vendeta
fonte
Você pode olhar para a probabilidade de que a última tirada An é menor do que o mínimo de tudo previamente traçado A , ea probabilidade de que a última Bn é maior do que o máximo de tudo desenhado anteriormente B . Isso deve ser útil. Aumente a probabilidade de explicar o fato de que não precisamos do último , mas de qualquer um. (Eu não tenho tempo para trabalhar com isso, mas parece um pequeno problema divertido. Boa sorte!)
S. Kolassa - Restabelece Monica 20/15
Pode ser um pouco surpreendente que (1) a resposta não dependa da distribuição (apenas que seja contínua) e (2) para n>1 seja constante!
whuber
1
É assim que o n th intervalo é construted: i) desenhar dois números uniformemente aleatoriamente em [0,1], ii) deixar a uma menor ser An e quanto maior for um Bn ?
Ekvall

Respostas:

5

Este post responde à pergunta e descreve o progresso parcial para provar que está correto.


Para , a resposta trivialmente é 1 . Para todos maior n , é (surpreendentemente) sempre 2 / 3 .n=11n2/3

Para entender por que, observe primeiro que a questão pode ser generalizada para qualquer distribuição contínua (no lugar da distribuição uniforme). O processo pelo qual os n intervalos são gerados equivale a desenhar 2 n iid varia X 1 , X 2 , , X 2 n de F e formar os intervalosFn2nX1,X2,,X2nF

[min(X1,X2),max(X1,X2)],,[min(X2n1,X2n),max(X2n1,X2n)].

Como todos os do X i são independentes, eles são trocáveis. Isso significa que a solução seria a mesma se permitíssemos aleatoriamente todos eles. Portanto, vamos condicionar as estatísticas de ordem obtidas ordenando o X i :2nXiXi

X(1)<X(2)<<X(2n)

(onde é contínuo, não há chance de dois serem iguais). Os intervalos n são formados selecionando uma permutação aleatória σ S 2 n e conectando-os em paresFnσS2n

[min(Xσ(1),Xσ(2)),max(Xσ(1),Xσ(2))],,[min(Xσ(2n1),Xσ(2n)),max(Xσ(2n1),Xσ(2n))].

Se dois deles se sobrepõem ou não, não depende dos valores de ,X(i) porque a sobreposição é preservada por qualquer transformação monotônica e existem essas transformações que enviam X ( i ) para i . Assim, sem qualquer perda de generalidade, podemos tomar X ( i ) = i e a questão passa a ser:f:RRX(i)iX(i)=i

Deixe o conjunto ser particionado em n doubletons separados. Quaisquer dois deles, { l 1 , R 1 } e { l 2 , R 2 } (com l i < r i ), se sobrepõem quando r 1 > l 2 e R 2 > l 1{1,2,,2n1,2n}n{l1,r1}{l2,r2}li<rir1>l2r2>l1. Diga que uma partição é "boa" quando pelo menos um de seus elementos se sobrepõe a todas as outras (e, caso contrário, é "ruim"). Em função de , qual é a proporção de boas partições?n

Para ilustrar, considere o caso . Existem três partições,n=2

{{1,2},{3,4}}, {{1,4},{2,3}}, {{1,3},{2,4}},

dos quais os dois bons (o segundo e o terceiro) foram de cor vermelha. Assim, a resposta no caso é 2 / 3 .n=22/3

Podemos representar graficamente essas partições , plotando os pontos { 1 , 2 , , 2 n } em uma linha numérica e desenhando segmentos de linha entre cada l i e r i , deslocando-os levemente para resolver sobreposições visuais. Aqui estão os gráficos das três partições anteriores, na mesma ordem e com a mesma cor:{{li,ri},i=1,2,,n}{1,2,,2n}liri

Figure 1

A partir de agora, para encaixar tais parcelas facilmente neste formato, eu as virarei de lado. Por exemplo, aqui estão as partições para n = 3 , mais uma vez com as boas coloridas em vermelho:15n=3

Figure 2

Dez são boas, de modo que a resposta para é 10 / 15 = 2 / 3 .n=310/15=2/3

A primeira situação interessante ocorre quando . Agora, pela primeira vez, é possível que a união dos intervalos abranja 1 a 2 n sem que nenhum deles cruze os outros. Um exemplo é { { 1 , 3 } , { 2 , 5 } , { 4 , 7 } , { 6 , 8 } } . A união dos segmentos de linha corre ininterrupta de 1 a 8n=412n{{1,3},{2,5},{4,7},{6,8}}18mas essa não é uma boa partição. No entanto, dos 105 partições são boas e a proporção permanece 2 / 3 .701052/3


O número de partições aumenta rapidamente com : é igual a 1 3 5 2 n - 1 = ( 2 n ) ! / ( 2 n n ! ) . Enumeração exaustiva de todas as possibilidades através n = 7 continua para se obter 2 / 3 como a resposta. As simulações de Monte Carlo através de n = 100 (usando 10000 iterações em cada) não mostram desvios significativos de 2n1352n1=(2n)!/(2nn!)n=72/3n=10010000 .2/3

2:1Xi

whuber
fonte
Xiiid
1
@Student To "condition on" means to say, let's temporarily hold these values fixed and consider what we can learn from that. Later, we will let those values vary (according to their probability distribution). In this case, once we find that the answer is 2/3 regardless of the fixed values of the order statistics, then we no longer have to carry out the second step of varying the order statistics. Mathematically, the order stats are a vector-valued variable X and the indicator of being good is Y, so
E(Y)=E(E(Y|X))=E(2/3)=2/3.
whuber