Se A é distribuído uniformemente em [8,10] e B em [9,11], qual é a probabilidade de B <A?

7

Fiz essa pergunta em uma entrevista e inicialmente não respondi corretamente, apesar de ainda achar que minha interpretação pode ter sido a correta. A questão era:

Existem dois caminhões de entrega, A e B. A faz entregas entre 8h e 10h, e B faz entregas entre 9h e 11h. As entregas são distribuídas uniformemente para ambos. Qual é a probabilidade de que qualquer entrega de B ocorra antes de qualquer entrega de A?

Qual é a sua resposta e por quê?

JPMaverick
fonte

Respostas:

11

É 1/8. Veja a figura abaixo, que mostra o tempo de entrega de A no eixo x e B no eixo y. Como as entregas são distribuídas uniformemente, todos os pontos do quadrado têm a mesma probabilidade de ocorrer. B entrega antes de A apenas na região sombreada, que é 1/8 do valor total.

insira a descrição da imagem aqui

Outra maneira de pensar é que há 50% de chance de A entregar antes que B comece, e 50% de chance de B entregar depois que A terminar, o que significa que há 75% de chance de um ou dos dois acontecerem. Na chance de 25% que ambos oferecem na hora de sobreposição, é uma chance de 50 a 50 que entrega primeiro.

Wang nuclear
fonte
Obrigado pela resposta e especialmente pelo gráfico, e essa é a resposta que eu dei (usando a sua "outra maneira de pensar sobre isso"). Mas, como a pergunta foi feita apenas às viagens de B, parece-me que são na verdade 1/4, pois para cada 100 viagens de B, 25 delas estão antes de A na hora que se sobrepõe. Em outras palavras, por que a parte em que não havia chance de B chegar primeiro porque B não estava fazendo nenhuma viagem valer? Eu li a pergunta apenas perguntando sobre as viagens de B. Mas minhas habilidades de probabilidade são reconhecidamente fracas após anos de desuso.
JPMaverick
A resposta é válida porque está perguntando sobre "qualquer entrega de B" em comparação com "qualquer entrega de A". Imagine um caso em que A seja entregue das 6h às 10h, em vez das 8h às 10h. Agora é ainda menos provável que uma entrega aleatória de B seja realizada antes de uma entrega aleatória de A. Se você não contar as entregas de A que ocorrem fora do horário de B, estender a janela de entrega de A para mais cedo não terá efeito.
Nuclear Wang
Perfeito, entendi. Muito obrigado. Acho que não vai ter admitido no programa, lol
JPMaverick
Ainda não consigo esquecer isso, porque ainda me parece que a janela de A se estende é irrelevante se a pergunta for "De todas as viagens de B, qual a porcentagem delas ocorrida antes de pelo menos uma das viagens de A". Como a distribuição é uniforme, o número de viagens potencialmente sobrepostas não muda, estendendo a janela de entrega de A. Parece que não há realmente nenhuma resposta possível sem conhecer as taxas de entrega de A e B, se as perguntas forem feitas apenas sobre B (como era). Desculpe por ser densa, se eu sou, e perfeitamente compreensível se isso está ficando chato
JPMaverick
11
@JPMaverick, concordo que a redação exata da pergunta é importante. Essa resposta funciona quando está redigida como "qualquer entrega de B" e "entrega de A". Se comparar "qualquer entrega de B" a "qualquer entrega de A", precisamos saber quantas entregas A faz. Se A faz um milhão de entregas entre 8 e 10, é extremamente improvável que uma entrega aleatória de B ocorra antes de A entregar qualquer coisa. Se A fizer apenas duas entregas nesse período, é razoavelmente possível que "qualquer entrega de B" ocorra antes de "qualquer" entrega de A (ou seja, a primeira entrega de A).
Nuclear Wang
3

Como as taxas de entrega não estão especificadas, vamos assumir que A entrega uma pacotes por hora e B entrega bpacotes por hora. Então existem2uma2bpares de prazos de entrega. A janela em que A e B se sobrepõem nos tempos de entrega apenasumab pares, na metade dos quais A vem antes de B. Portanto, a proporção de pares nos quais A vem antes de B é

umab21 12uma2b=1 18.
katosh
fonte
0

Proponho outra maneira de ver, apenas se você tiver um computador durante a entrevista, é claro.

Podemos simular o processo com R, por exemplo.

Vamos simular 1000 valores de A e o mesmo de B, sabemos que ambos são uniformes, são independentes.

a <- runif(1000, 8, 10) # A deliveries
b <- runif(1000, 9, 11) # B deliveries
# [1] 9.485513 8.665070 8.488481 8.840332 8.755384 9.448949 # A deliveries for example

Ok, não são exatamente horas, mas é a mesma coisa.

A probabilidade P(B<UMA)é o que buscamos. Então, contamos apenas o número de pares em queb<uma no nosso código.

prob <- sum(b < a)/1000
#[1] 0.112 # almost 1/8

Também podemos traçar os 1000 pares (uma,b)e veja a região em que B vem primeiro.

plot(a, b)
polygon(c(9, 10, 10, 9),
        c(9, 9, 10, 9), density = 10, angle = 135)

insira a descrição da imagem aqui

E o probvalor acima é a proporção de pontos na região sombreada (parece familiar, não é?).

Agora, poderíamos usar a fórmula para o erro padrão de uma proporção para estimar o erro padrão da simulação.

se <- sqrt(prob * (1 - prob) / 1000)
#[1] 0.009972763

E podemos construir um IC (assumindo uma aproximação normal da distribuição da amostra de probs).

prob - 1.96*se
#[1] 0.09245338 lower bound
prob + 1.96*se
#[1] 0.1315466 upper bound
RLave
fonte
-1

Tropecei e isso entrou na minha cabeça. :-)

A resposta parece que deve depender do número relativo de entregas que cada caminhão faz na hora da possível sobreposição (9a-10a) - não há resposta constante.

Por exemplo, suponha que cada caminhão faça 2 entregas totais (1 por hora). Cada um deles faria 1 entrega entre 9 e 10 e B não superaria nada de A. Portanto, a probabilidade é 0 nesse caso.

Considere uma versão simplificada do problema em que ambos fazem entregas entre 9 e 10a (ainda uma distribuição uniforme). E, para iniciantes, suponha que eles façam o mesmo número de entregas, n.

  • A primeira entrega de B supera tudo, exceto a primeira entrega de A (que está vinculada). Então, com probabilidade1 1n (a probabilidade de sermos a primeira entrega de B) vencemos um evento com probabilidade n-1 1n (a probabilidade de não sermos a primeira entrega de A)
  • A segunda entrega de B superará tudo, exceto as duas primeiras entregas de A. Então, com probabilidade 1 1n vencemos um evento com probabilidade n-2n
  • etc.

Colocando cada um desses termos em uma soma, obtemos:

(1 1nn-1 1n)+(1 1nn-2n)+...+(1 1nn-nn)

Ou,

Eu=1 1nn-Eun2

Como as probabilidades são uniformes e metade (arredondada para baixo) de cada ocorre durante a hora da sobreposição, consideramos apenas metade das entregas de cada uma. E sen=n2e, comparados a todo o domínio, esses eventos acontecem apenas metade do tempo. assim

1 12Eu=1 1nn-Eun2

Eu acredito que para uma=b=nvocê obtém 1 1/8.

Como lidar com o fato de que A e B não entregam o mesmo número de pacotes? Mais uma vez, para simplificar, assuma que todas as entregas acontecem entre 9 e 10 horas.

Para cada entrega b você considera do mais antigo ao mais recente, em vez de cada um sucessivo 1 1uma menos do caminhão A, como acima (onde uma é o número de entregas efetuadas pelo caminhão A e b o número de entregas feitas por b), você elimina 1 1buma. Ou seja, você vence tudo, exceto uma fração deuma proporcional à fração de bvocê jogou fora. Assim,

(1 1buma-1 1umabuma)+(1 1bn-2umabuma)+...+(1 1buma-umaumabuma)

Ou,

Eu=1 1buma-Euumabumab

Mais uma vez, considerando o fato de que eles se sobrepõem apenas metade do tempo, vamos uma=uma2 e b=b2:

1 12Eu=1 1buma-Euumabumab

Tommy
fonte
A pergunta pede uma probabilidade. É difícil encontrar valores realistas deuma,b, e n para as quais suas fórmulas produzem resultados entre 0 0 e 1 1,então eles devem estar errados. Como outros entrevistados têm demonstrado, não é uma resposta única. Deriva do pressuposto de uma distribuição de probabilidade uniforme para o tempo de entrega de cada caminhão.
whuber
-1

É zero:

se o caminhão B tiver pelo menos uma entrega no período de [9-11], pelo menos uma entrega será feita após (ou igual a) 10

e essa entrega não ocorre antes das entregas de A (que são todas antes das 10)

Ormoz
fonte