Por favor, explique o paradoxo da espera

75

Alguns anos atrás, projetei um detector de radiação que funciona medindo o intervalo entre os eventos, em vez de contá-los. Minha suposição era que, ao medir amostras não contíguas, em média eu media metade do intervalo real. No entanto, quando testei o circuito com uma fonte calibrada, a leitura era um fator dois alto demais, o que significava que eu estava medindo o intervalo completo.

Em um livro antigo sobre probabilidade e estatística, encontrei uma seção sobre algo chamado "The Waiting Paradox". Apresentou um exemplo em que um ônibus chega ao ponto de ônibus a cada 15 minutos e um passageiro chega aleatoriamente; afirmou que o passageiro esperaria, em média, os 15 minutos completos. Eu nunca fui capaz de entender a matemática apresentada com o exemplo e continuar procurando uma explicação. Se alguém puder explicar por que é que o passageiro espera o intervalo inteiro, dormirei melhor.

Stephen Sackett
fonte
1
Qual é o título e quem é o autor do livro? Você poderia copiar a palavra exemplo por palavra aqui?
Joel Reyes Noche
Essa não é minha especialidade, mas o paradoxo mencionado pelo OP é o mesmo que o paradoxo da inspeção ?
Joel Reyes Noche
1
Parece que meu palpite acima tem algum apoio. Um comentário a esta resposta menciona o paradoxo da inspeção.
Joel Reyes Noche
2
Eu acho que usar um ônibus como analogia é confuso, pois os ônibus tendem a seguir os horários. Em vez disso, pense em quanto tempo levará para um táxi vazio chegar, quando em média um chega a cada 15 minutos.
Harvey Motulsky

Respostas:

48

Como Glen_b apontou, se os ônibus chegam a cada minutos sem qualquer incerteza , sabemos que o tempo máximo de espera possível é de 15 minutos. Se da nossa parte chegarmos "aleatoriamente", sentimos que "em média" esperaremos metade do tempo máximo de espera possível . E o tempo máximo de espera possível é igual ao comprimento máximo possível entre duas chegadas consecutivas. Indique nosso tempo de espera W e o comprimento máximo entre duas chegadas consecutivas de ônibus R , e argumentamos que1515WR

(1)E(W)=12R=152=7,5

e estamos certos.

Mas de repente a certeza é tirada de nós e somos informados de que minutos são agora a duração média entre duas chegadas de ônibus. E caímos na "armadilha do pensamento intuitivo" e pensamos: "precisamos apenas substituir R pelo seu valor esperado" e argumentamos15R

2)E(W)=12E(R)=152=7,5ERRADO

Uma primeira indicação de que estamos errados é que não é "comprimento entre duas chegadas de ônibus consecutivas", é " comprimento máximo, etc." Portanto, em qualquer caso, temos esse E ( R ) 15 .RE(R)15

Como chegamos à equação ? Pensamos: "o tempo de espera pode ser de 0 a 15 no máximo . Chego com igual probabilidade em qualquer instância, então" escolho "aleatoriamente e com igual probabilidade todos os tempos de espera possíveis. Portanto, metade do comprimento máximo entre duas chegadas de ônibus consecutivas é meu tempo médio de espera ". E nós estamos certos.(1)0 015

Mas, ao inserir erroneamente o valor na equação ( 2 ) , ele não reflete mais o nosso comportamento. Com 15 no lugar de E ( R ) , a equação ( 2 ) diz "Escolho aleatoriamente e com igual probabilidade todos os tempos de espera possíveis menores ou iguais à duração média entre duas chegadas consecutivas de ônibus " - e é aqui que nossa intuitiva o erro está, porque nosso comportamento não muda - então, ao chegar de maneira aleatória e uniforme, na realidade ainda "escolhemos aleatoriamente e com igual probabilidade" todos os tempos de espera possíveis - mas "todos os tempos de espera possíveis" não são capturados por15(2)15E(R)(2) - esquecemos a parte direita da distribuição de comprimentos entre duas chegadas consecutivas de ônibus. 15

Então, talvez, devamos calcular o valor esperado do comprimento máximo entre duas chegadas de ônibus consecutivas. Essa é a solução correta?

Sim, poderia ser, mas : o "paradoxo" específico anda de mãos dadas com uma suposição estocástica específica: que as chegadas de ônibus são modeladas pelo processo de referência de Poisson, o que significa que, como conseqüência, assumimos que o tempo entre quaisquer duas chegadas consecutivas de ônibus seguem uma distribuição exponencial. Denote esse comprimento, e nós temos esse

f()=λe-λ,λ=1/15,E()=15

Isso é aproximado, é claro, uma vez que a distribuição exponencial tem suporte ilimitado da direita, o que significa que, estritamente falando, "todos os tempos de espera possíveis" incluem, sob essa premissa de modelagem, magnitudes maiores e maiores até e "incluindo" o infinito, mas com probabilidade de fuga .

Mas espere, o exponencial é sem memória : não importa em que ponto no tempo que vai chegar, nos deparamos com a mesma variável aleatória , independentemente do que se passou antes.

Dada essa suposição estocástica / distributiva, qualquer ponto no tempo faz parte de um "intervalo entre duas chegadas de ônibus consecutivas" cujo comprimento é descrito pela mesma distribuição de probabilidade com valor esperado (não valor máximo) : "Estou aqui, estou cercado por um intervalo entre duas chegadas de ônibus, parte do seu comprimento está no passado e no futuro, mas não tenho como saber quanto e quanto, então o melhor que posso fazer é perguntar: qual é o comprimento esperado? qual será o meu tempo médio de espera? " - E a resposta é sempre " 15 ", infelizmente. 1515

Alecos Papadopoulos
fonte
f()fλ()
fX(y)
80

Se o ônibus chegar "a cada 15 minutos" (ou seja, em um horário), a espera média do passageiro (chegando aleatoriamente) é de fato apenas 7,5 minutos, porque será distribuído uniformemente nesse intervalo de 15 minutos.

-

Se, por outro lado, o ônibus chegar aleatoriamente à taxa média de 4 por hora (ou seja, de acordo com um processo de Poisson), a espera média será muito maior; na verdade, você pode resolver isso através da falta de propriedade da memória. Tome a chegada do passageiro como o início e o tempo para o próximo evento é exponencial, com média de 15 minutos.

Deixe-me fazer uma analogia de tempo discreto. Imagine que estou rolando um dado com 15 faces, uma das quais é rotulada "B" (para ônibus) e 14 rotulada "X" para a total ausência de ônibus naquele minuto ( existem dados justos de 30 lados , para que eu pudesse rotular 2 dos faces de um dado de 30 lados "B"). Então, uma vez por minuto, eu rolo e vejo se o ônibus chega. O dado não tem memória; não sabe quantos rolos desde o último "B" já foi. Agora imagine que algum evento desconectado acontece - um cachorro late, um passageiro chega, ouço um estrondo de trovão. A partir de agora, quanto tempo espero (quantos rolos) até o próximo "B"?

Devido à falta de memória, em média, espero o mesmo tempo pelo próximo "B" que o tempo entre dois "B" s consecutivos.

[A seguir, imagine que tenho um dado de 60 lados e rolo a cada quinze segundos (novamente, com uma face "B"); agora imagine que eu tinha um dado de 1000 lados que rolava a cada 0,9 segundos (com uma face "B"; ou, mais realista, três dados de 10 lados cada e chamo o resultado de "B" se todos os 3 aparecerem "10" em ao mesmo tempo) ... e assim por diante. No limite, obtemos o tempo contínuo do processo de Poisson.]

tt

Como um apanhador de ônibus veterano, na prática, a realidade parece estar em algum lugar entre "os ônibus chegam de acordo com o horário" e "os ônibus chegam aleatoriamente". E, às vezes (com tráfego ruim), você espera uma hora e três chegam de uma só vez (Zach identifica o motivo nos comentários abaixo).

Glen_b
fonte
6
Eu acho que, com os ônibus, especificamente, há um processo adicional em que um ônibus atrasado se torna mais tarde, à medida que os passageiros se amontoam nele, e o ônibus vazio atrás dele finalmente o alcança (mas permanece vazio). = D
Zach
4
@ Zach, de fato, é por isso que eles tendem a se aglomerar a longo prazo, especialmente no tráfego pesado. Onde eu moro quando o ônibus chega tão tarde que já é hora do próximo, às vezes eles inserem um ônibus adicional que está quase na hora ao longo da rota (ou seja, ele dirige sem passageiros para onde o ônibus não fica muito atrás agendar, geralmente chegando lá por uma rota mais rápida) e começar a pegar passageiros para quem agora o ônibus está um pouco atrasado. Enquanto isso, o ônibus muito atrasado agora se torna efetivamente o próximo ônibus no horário, uma vez que chega até onde o outro ônibus entrou.
Glen_b
@Glen_b Essa é realmente uma boa ideia, hah!
Zach
É uma estratégia anti-agrupamento útil (pelo menos, atenua os piores casos); Eu não teria trazido isso à tona, exceto que se relaciona ao tipo de problemas de dependência com os quais os modelos mais precisos de tempo de espera de ônibus podem precisar lidar.
Glen_b
10

Mais sobre ônibus ... Desculpe por entrar na conversa tão tarde na discussão, mas tenho analisado os processos de Poisson recentemente ... Então, antes que ele saia da minha cabeça, aqui está uma representação pictórica do paradoxo da inspeção :

λθ=1/λ=15

Se estivéssemos em um centro de expedição e pudéssemos ver todos os ônibus em uma tela, seria verdade que pegar aleatoriamente vários ônibus e calcular a média da distância até o ônibus que seguia atrás produziria o tempo médio entre chegadas:

insira a descrição da imagem aqui

Mas, se o que fazemos é apenas aparecer na estação de ônibus (em vez de selecionar um ônibus), estamos fazendo uma seção aleatória de tempo, digamos, ao longo da linha do tempo do horário do ônibus em uma manhã típica. O tempo que decidimos aparecer na rodoviária pode muito bem ser uniformemente distribuído ao longo da "flecha" do tempo. No entanto, como há intervalos de tempo mais longos entre os ônibus, mais afastados, é mais provável que acabemos superestimando esses "retardatários":

insira a descrição da imagem aqui

... e, portanto, nosso registro de tempo de espera não refletirá o tempo de chegada. Este é o paradoxo da inspeção.

15θ=15

E[tempo em espera (futuro) + tempo para a última partida do ônibus (passado)]=30


insira a descrição da imagem aqui


Ainda não está claro? - experimente com Legos .

Antoni Parellada
fonte
Excelentes diagramas.
Glen_b 30/04
2

Existe uma explicação simples que resolve as diferentes respostas que se obtém do cálculo do tempo de espera esperado para ônibus que chegam por um Processo de Poisson com um tempo médio de chegada (neste caso, 15 minutos), cujos tempos de chegada são, portanto, exponenciais com média de 15 minutos .

Método 1 ) Como o Processo Poisson (exponencial) não possui memória, o tempo de espera esperado é de 15 minutos.

Método 2 ) É provável que você chegue a qualquer momento durante o período entre chegadas em que você chegar. Portanto, o tempo de espera esperado é 1/2 da duração esperada deste período entre chegadas. ISSO ESTÁ CORRETO, e não entra em conflito com o método (1).

Como (1) e (2) podem estar corretos? A resposta é que a duração esperada do período entre chegadas para o horário em que você chega não é de 15 minutos. São na verdade 30 minutos; e 1/2 de 30 minutos são 15 minutos, então (1) e (2) concordam.

Por que o período entre chegadas do horário em que você chega não é igual a 15 minutos? Isso ocorre porque, ao "fixar" primeiro um horário de chegada, o período entre chegadas é mais provável que a média para ser um longo período entre chegadas. No caso de um período entre chegadas exponenciais, a matemática funciona assim, o período entre chegadas contendo o horário em que você chega é um exponencial com o dobro do tempo médio entre chegadas do processo de Poisson.

Não é óbvio que a distribuição exata para o tempo entre chegadas que contém o horário em que você chega seria uma exponencial com média dobrada, mas é óbvio, após explicação, por que é aumentado. Como um exemplo fácil de entender, digamos que os tempos entre chegadas são 10 minutos com probabilidade 1/2 ou 20 minutos com probabilidade 1/2. Nesse caso, é provável que ocorram períodos inter-chegada de 20 minutos com períodos inter-chegada de 10 minutos, mas quando ocorrem, duram duas vezes mais. Portanto, 2/3 dos pontos do tempo durante o dia serão nos horários em que o período entre chegadas é de 20 minutos. Em outras palavras, se escolhermos um horário primeiro e depois quisermos saber qual é o horário entre chegadas que contém esse horário, então (ignorando os efeitos transitórios no início do "dia") ) a duração esperada desse tempo entre chegadas é 16 1/3. Mas se primeiro escolhermos o tempo entre chegadas e quisermos saber qual é a duração esperada, são 15 minutos.

Existem outras variantes do paradoxo da renovação, amostragem com viés de comprimento, etc., que representam praticamente a mesma coisa.

Exemplo 1) Você tem várias lâmpadas, com vida útil aleatória, mas média de 1000 horas. Quando uma lâmpada falha, é imediatamente substituída por outra lâmpada. Se você escolher um horário para ir a uma sala com a lâmpada, a lâmpada em operação acabará tendo uma vida útil média mais longa que 1000 horas.

Exemplo 2) Se formos a um canteiro de obras em um determinado momento, o tempo médio até que um trabalhador da construção civil que trabalhe lá naquele momento caia do prédio (de quando eles começaram a trabalhar) seja maior que o tempo médio até o trabalhador cai (de quando começaram a trabalhar) de todos os trabalhadores que começam a trabalhar. Por que, porque os trabalhadores com um tempo médio curto até cair caem mais do que a média já caíram (e não continuaram a trabalhar), de modo que os trabalhadores que estão trabalhando têm mais tempo do que a média até cair.

Exemplo 3) Escolha um número modesto de pessoas aleatoriamente em uma cidade e se eles participaram dos jogos em casa (nem todos os ingressos esgotados) do time de beisebol da Major League da cidade, descubra quantas pessoas assistiram aos jogos em que estavam. Então (sob algumas premissas ligeiramente idealizadas, mas não muito irracionais), a frequência média para esses jogos será maior que a freqüência média para todos os jogos em casa da equipe. Por quê? Como há mais pessoas que participaram de jogos de alta frequência do que jogos de baixa frequência, é mais provável que você escolha pessoas que participaram de jogos de alta frequência do que jogos de baixa freqüência.

Mark L. Stone
fonte
0

A questão colocada era "... um ônibus chega ao ponto a cada 15 minutos e um passageiro chega aleatoriamente". Se o ônibus chegar a cada 15 minutos, então não é aleatório; chega a cada 15 minutos, portanto a resposta correta é 7,5 minutos. A fonte foi citada incorretamente ou o gravador da fonte foi desleixado.

Por outro lado, o detector de radiação parece um problema diferente, porque os eventos de radiação chegam aleatoriamente de acordo com alguma distribuição, presumivelmente algo como Poisson com um tempo médio de espera.

Emil Friedman
fonte