Alguns anos atrás, projetei um detector de radiação que funciona medindo o intervalo entre os eventos, em vez de contá-los. Minha suposição era que, ao medir amostras não contíguas, em média eu media metade do intervalo real. No entanto, quando testei o circuito com uma fonte calibrada, a leitura era um fator dois alto demais, o que significava que eu estava medindo o intervalo completo.
Em um livro antigo sobre probabilidade e estatística, encontrei uma seção sobre algo chamado "The Waiting Paradox". Apresentou um exemplo em que um ônibus chega ao ponto de ônibus a cada 15 minutos e um passageiro chega aleatoriamente; afirmou que o passageiro esperaria, em média, os 15 minutos completos. Eu nunca fui capaz de entender a matemática apresentada com o exemplo e continuar procurando uma explicação. Se alguém puder explicar por que é que o passageiro espera o intervalo inteiro, dormirei melhor.
fonte
Respostas:
Como Glen_b apontou, se os ônibus chegam a cada minutos sem qualquer incerteza , sabemos que o tempo máximo de espera possível é de 15 minutos. Se da nossa parte chegarmos "aleatoriamente", sentimos que "em média" esperaremos metade do tempo máximo de espera possível . E o tempo máximo de espera possível é igual ao comprimento máximo possível entre duas chegadas consecutivas. Indique nosso tempo de espera W e o comprimento máximo entre duas chegadas consecutivas de ônibus R , e argumentamos que15 15 W R
e estamos certos.
Mas de repente a certeza é tirada de nós e somos informados de que minutos são agora a duração média entre duas chegadas de ônibus. E caímos na "armadilha do pensamento intuitivo" e pensamos: "precisamos apenas substituir R pelo seu valor esperado" e argumentamos15 R
Uma primeira indicação de que estamos errados é que não é "comprimento entre duas chegadas de ônibus consecutivas", é " comprimento máximo, etc." Portanto, em qualquer caso, temos esse E ( R ) ≠ 15 .R E( R ) ≠ 15
Como chegamos à equação ? Pensamos: "o tempo de espera pode ser de 0 a 15 no máximo . Chego com igual probabilidade em qualquer instância, então" escolho "aleatoriamente e com igual probabilidade todos os tempos de espera possíveis. Portanto, metade do comprimento máximo entre duas chegadas de ônibus consecutivas é meu tempo médio de espera ". E nós estamos certos.( 1 ) 0 0 15
Mas, ao inserir erroneamente o valor na equação ( 2 ) , ele não reflete mais o nosso comportamento. Com 15 no lugar de E ( R ) , a equação ( 2 ) diz "Escolho aleatoriamente e com igual probabilidade todos os tempos de espera possíveis menores ou iguais à duração média entre duas chegadas consecutivas de ônibus " - e é aqui que nossa intuitiva o erro está, porque nosso comportamento não muda - então, ao chegar de maneira aleatória e uniforme, na realidade ainda "escolhemos aleatoriamente e com igual probabilidade" todos os tempos de espera possíveis - mas "todos os tempos de espera possíveis" não são capturados por15 ( 2 ) 15 E( R ) ( 2 ) - esquecemos a parte direita da distribuição de comprimentos entre duas chegadas consecutivas de ônibus. 15
Então, talvez, devamos calcular o valor esperado do comprimento máximo entre duas chegadas de ônibus consecutivas. Essa é a solução correta?
Sim, poderia ser, mas : o "paradoxo" específico anda de mãos dadas com uma suposição estocástica específica: que as chegadas de ônibus são modeladas pelo processo de referência de Poisson, o que significa que, como conseqüência, assumimos que o tempo entre quaisquer duas chegadas consecutivas de ônibus seguem uma distribuição exponencial. Denote esse comprimento, e nós temos esseℓ
Isso é aproximado, é claro, uma vez que a distribuição exponencial tem suporte ilimitado da direita, o que significa que, estritamente falando, "todos os tempos de espera possíveis" incluem, sob essa premissa de modelagem, magnitudes maiores e maiores até e "incluindo" o infinito, mas com probabilidade de fuga .
Mas espere, o exponencial é sem memória : não importa em que ponto no tempo que vai chegar, nos deparamos com a mesma variável aleatória , independentemente do que se passou antes.
Dada essa suposição estocástica / distributiva, qualquer ponto no tempo faz parte de um "intervalo entre duas chegadas de ônibus consecutivas" cujo comprimento é descrito pela mesma distribuição de probabilidade com valor esperado (não valor máximo) : "Estou aqui, estou cercado por um intervalo entre duas chegadas de ônibus, parte do seu comprimento está no passado e no futuro, mas não tenho como saber quanto e quanto, então o melhor que posso fazer é perguntar: qual é o comprimento esperado? qual será o meu tempo médio de espera? " - E a resposta é sempre " 15 ", infelizmente.15 15
fonte
Se o ônibus chegar "a cada 15 minutos" (ou seja, em um horário), a espera média do passageiro (chegando aleatoriamente) é de fato apenas 7,5 minutos, porque será distribuído uniformemente nesse intervalo de 15 minutos.
-
Se, por outro lado, o ônibus chegar aleatoriamente à taxa média de 4 por hora (ou seja, de acordo com um processo de Poisson), a espera média será muito maior; na verdade, você pode resolver isso através da falta de propriedade da memória. Tome a chegada do passageiro como o início e o tempo para o próximo evento é exponencial, com média de 15 minutos.
Deixe-me fazer uma analogia de tempo discreto. Imagine que estou rolando um dado com 15 faces, uma das quais é rotulada "B" (para ônibus) e 14 rotulada "X" para a total ausência de ônibus naquele minuto ( existem dados justos de 30 lados , para que eu pudesse rotular 2 dos faces de um dado de 30 lados "B"). Então, uma vez por minuto, eu rolo e vejo se o ônibus chega. O dado não tem memória; não sabe quantos rolos desde o último "B" já foi. Agora imagine que algum evento desconectado acontece - um cachorro late, um passageiro chega, ouço um estrondo de trovão. A partir de agora, quanto tempo espero (quantos rolos) até o próximo "B"?
Devido à falta de memória, em média, espero o mesmo tempo pelo próximo "B" que o tempo entre dois "B" s consecutivos.
[A seguir, imagine que tenho um dado de 60 lados e rolo a cada quinze segundos (novamente, com uma face "B"); agora imagine que eu tinha um dado de 1000 lados que rolava a cada 0,9 segundos (com uma face "B"; ou, mais realista, três dados de 10 lados cada e chamo o resultado de "B" se todos os 3 aparecerem "10" em ao mesmo tempo) ... e assim por diante. No limite, obtemos o tempo contínuo do processo de Poisson.]
Como um apanhador de ônibus veterano, na prática, a realidade parece estar em algum lugar entre "os ônibus chegam de acordo com o horário" e "os ônibus chegam aleatoriamente". E, às vezes (com tráfego ruim), você espera uma hora e três chegam de uma só vez (Zach identifica o motivo nos comentários abaixo).
fonte
Mais sobre ônibus ... Desculpe por entrar na conversa tão tarde na discussão, mas tenho analisado os processos de Poisson recentemente ... Então, antes que ele saia da minha cabeça, aqui está uma representação pictórica do paradoxo da inspeção :
Se estivéssemos em um centro de expedição e pudéssemos ver todos os ônibus em uma tela, seria verdade que pegar aleatoriamente vários ônibus e calcular a média da distância até o ônibus que seguia atrás produziria o tempo médio entre chegadas:
Mas, se o que fazemos é apenas aparecer na estação de ônibus (em vez de selecionar um ônibus), estamos fazendo uma seção aleatória de tempo, digamos, ao longo da linha do tempo do horário do ônibus em uma manhã típica. O tempo que decidimos aparecer na rodoviária pode muito bem ser uniformemente distribuído ao longo da "flecha" do tempo. No entanto, como há intervalos de tempo mais longos entre os ônibus, mais afastados, é mais provável que acabemos superestimando esses "retardatários":
... e, portanto, nosso registro de tempo de espera não refletirá o tempo de chegada. Este é o paradoxo da inspeção.
Ainda não está claro? - experimente com Legos .
fonte
Existe uma explicação simples que resolve as diferentes respostas que se obtém do cálculo do tempo de espera esperado para ônibus que chegam por um Processo de Poisson com um tempo médio de chegada (neste caso, 15 minutos), cujos tempos de chegada são, portanto, exponenciais com média de 15 minutos .
Método 1 ) Como o Processo Poisson (exponencial) não possui memória, o tempo de espera esperado é de 15 minutos.
Método 2 ) É provável que você chegue a qualquer momento durante o período entre chegadas em que você chegar. Portanto, o tempo de espera esperado é 1/2 da duração esperada deste período entre chegadas. ISSO ESTÁ CORRETO, e não entra em conflito com o método (1).
Como (1) e (2) podem estar corretos? A resposta é que a duração esperada do período entre chegadas para o horário em que você chega não é de 15 minutos. São na verdade 30 minutos; e 1/2 de 30 minutos são 15 minutos, então (1) e (2) concordam.
Por que o período entre chegadas do horário em que você chega não é igual a 15 minutos? Isso ocorre porque, ao "fixar" primeiro um horário de chegada, o período entre chegadas é mais provável que a média para ser um longo período entre chegadas. No caso de um período entre chegadas exponenciais, a matemática funciona assim, o período entre chegadas contendo o horário em que você chega é um exponencial com o dobro do tempo médio entre chegadas do processo de Poisson.
Não é óbvio que a distribuição exata para o tempo entre chegadas que contém o horário em que você chega seria uma exponencial com média dobrada, mas é óbvio, após explicação, por que é aumentado. Como um exemplo fácil de entender, digamos que os tempos entre chegadas são 10 minutos com probabilidade 1/2 ou 20 minutos com probabilidade 1/2. Nesse caso, é provável que ocorram períodos inter-chegada de 20 minutos com períodos inter-chegada de 10 minutos, mas quando ocorrem, duram duas vezes mais. Portanto, 2/3 dos pontos do tempo durante o dia serão nos horários em que o período entre chegadas é de 20 minutos. Em outras palavras, se escolhermos um horário primeiro e depois quisermos saber qual é o horário entre chegadas que contém esse horário, então (ignorando os efeitos transitórios no início do "dia") ) a duração esperada desse tempo entre chegadas é 16 1/3. Mas se primeiro escolhermos o tempo entre chegadas e quisermos saber qual é a duração esperada, são 15 minutos.
Existem outras variantes do paradoxo da renovação, amostragem com viés de comprimento, etc., que representam praticamente a mesma coisa.
Exemplo 1) Você tem várias lâmpadas, com vida útil aleatória, mas média de 1000 horas. Quando uma lâmpada falha, é imediatamente substituída por outra lâmpada. Se você escolher um horário para ir a uma sala com a lâmpada, a lâmpada em operação acabará tendo uma vida útil média mais longa que 1000 horas.
Exemplo 2) Se formos a um canteiro de obras em um determinado momento, o tempo médio até que um trabalhador da construção civil que trabalhe lá naquele momento caia do prédio (de quando eles começaram a trabalhar) seja maior que o tempo médio até o trabalhador cai (de quando começaram a trabalhar) de todos os trabalhadores que começam a trabalhar. Por que, porque os trabalhadores com um tempo médio curto até cair caem mais do que a média já caíram (e não continuaram a trabalhar), de modo que os trabalhadores que estão trabalhando têm mais tempo do que a média até cair.
Exemplo 3) Escolha um número modesto de pessoas aleatoriamente em uma cidade e se eles participaram dos jogos em casa (nem todos os ingressos esgotados) do time de beisebol da Major League da cidade, descubra quantas pessoas assistiram aos jogos em que estavam. Então (sob algumas premissas ligeiramente idealizadas, mas não muito irracionais), a frequência média para esses jogos será maior que a freqüência média para todos os jogos em casa da equipe. Por quê? Como há mais pessoas que participaram de jogos de alta frequência do que jogos de baixa frequência, é mais provável que você escolha pessoas que participaram de jogos de alta frequência do que jogos de baixa freqüência.
fonte
A questão colocada era "... um ônibus chega ao ponto a cada 15 minutos e um passageiro chega aleatoriamente". Se o ônibus chegar a cada 15 minutos, então não é aleatório; chega a cada 15 minutos, portanto a resposta correta é 7,5 minutos. A fonte foi citada incorretamente ou o gravador da fonte foi desleixado.
Por outro lado, o detector de radiação parece um problema diferente, porque os eventos de radiação chegam aleatoriamente de acordo com alguma distribuição, presumivelmente algo como Poisson com um tempo médio de espera.
fonte