Quão estranho é um conjunto de acidentes de avião?

15

Pergunta original (25/7/14): Esta citação da mídia faz sentido ou existe uma maneira estatística melhor de ver a enxurrada de acidentes de avião recentes?

No entanto, Barnett também chama a atenção para a teoria da distribuição de Poisson, que implica que intervalos curtos entre colisões são realmente mais prováveis ​​do que longos.

"Suponha que exista uma média de um acidente fatal por ano, o que significa que a chance de um acidente em um determinado dia é uma em 365", diz Barnett. "Se ocorrer um acidente em 1º de agosto, a chance de o próximo acidente ocorrer um dia depois, em 2 de agosto é 1/365. Mas a chance do próximo acidente ocorrer em 3 de agosto é (364/365) x (1/365) , porque a próxima falha ocorre em 3 de agosto apenas se não houver falha em 2 de agosto ".

"Parece contra-intuitivo, mas a conclusão segue implacavelmente das leis da probabilidade", diz Barnett.

Fonte: http://www.bbc.com/news/magazine-28481060

Esclarecimento (27/7/14): O que é contra-intuitivo (para mim) é dizer que eventos raros tendem a ocorrer perto do tempo. Intuitivamente, eu pensaria que eventos raros não ocorreriam perto no tempo. Alguém pode me indicar uma distribuição teórica ou empírica esperada do tempo entre eventos sob as premissas de uma distribuição de Poisson? (Ou seja, um histograma em que o eixo y é a frequência ou probabilidade e o eixo x é o tempo entre duas ocorrências consecutivas agrupadas em dias, semanas, meses ou anos ou similares.) Obrigado.

Esclarecimento (28/7/14): A manchete indica que é mais provável que haja grupos de acidentes do que acidentes amplamente espaçados. Permite operacionalizar isso. Digamos que um cluster tenha 3 acidentes de avião e um curto período de tempo seja de 3 meses e um longo período de tempo seja de 3 anos. Parece ilógico pensar que há uma probabilidade mais alta de que três acidentes ocorram dentro de um período de 3 meses do que dentro de um período de 3 anos. Mesmo se considerarmos o primeiro acidente, é ilógico pensar que mais 2 acidentes ocorrerão nos próximos 3 meses, em comparação com os próximos 3 anos. Se isso for verdade, o título da mídia será enganoso e incorreto. Estou esquecendo de algo?

Joel W.
fonte
11
Sobre o esclarecimento: Você pode achar útil distinguir entre probabilidade , probabilidade por unidade de tempo e expectativa . Embora os processos que descrevem eventos raros tenham - praticamente pelo próprio significado de "raro" - um longo tempo esperado entre os eventos, isso não é inconsistente, pois a probabilidade por unidade de tempo é maior desde o início. No entanto, a probabilidade do próximo evento ocorrer dentro de um curto período de tempo será muito pequena.
whuber
2
Além disso, acabei de notar este artigo da Wikipedia - você pode gostar. Ah, e também me deparei com este pdf - ele menciona especificamente o "agrupamento" de acidentes de avião (e descreve a questão muito melhor do que eu tenho até agora ...).
28714 Steve
11
@Glen_b: A falha no artigo de jornal (implícita no título do artigo, que é o título da minha postagem) é que o artigo sugere que há uma maior probabilidade de um determinado número (ou seja, um cluster) de acidentes que ocorrem em um curto período de tempo do que durante um longo período de tempo. Isso está errado.
Joel W.
11
@ JoelW .: Se alguma coisa, seria o jornalista que estragou tudo ... De qualquer forma, está tudo esclarecido ou você ainda tem alguma reserva?
30514 Steve
11
Meu palpite é que foi o estatístico que enganou o jornalista. Duvido que o jornalista tenha entendido errado por si próprio (porque é tão contra-intuitivo).
Joel W.

Respostas:

3

Resumo: A primeira frase do parágrafo citado da BBC é superficial e enganosa.

Embora as respostas e comentários anteriores já tenham proporcionado uma excelente discussão, sinto que a questão principal não foi respondida satisfatoriamente.

Então, vamos supor que uma probabilidade de um acidente de avião em qualquer dia é e que as falhas são independentes um do outro. Vamos supor ainda que um avião caiu em 1º de janeiro. Quando o próximo avião cairia?p=1 1/365

Bem, vamos fazer uma simulação simples: para cada dia pelos próximos três anos, decidirei aleatoriamente se outro avião colidiu com probabilidade e anotarei o dia do próximo acidente; Vou repetir esse procedimento 100p vezes. Aqui está o histograma resultante:100000

Distribuição de esmagamentos de avião, um modelo

Pr(t)=(1 1-p)tpt

0,27%0,10%

0,8%94% É por isso que, mesmo com uma distribuição de probabilidade monotonicamente decrescente, é certamente possível que "aglomerados" (por exemplo, dois acidentes de avião em três dias) sejam muito improváveis.

Aqui está outro histograma para realmente entender esse ponto. É simplesmente uma soma do histograma anterior em vários períodos sem interseção:

Histograma de frequência de esmagamentos de avião

ameba diz Restabelecer Monica
fonte
Você está dizendo que o professor do MIT está errado?
Steve S
11
Não, a citação de Barnett no artigo da BBC está completamente correta. Mas sua interpretação pelo repórter da BBC é desleixada, na melhor das hipóteses: "Barnett também chama a atenção para a teoria da distribuição de Poisson, que implica que intervalos curtos entre batidas são realmente mais prováveis ​​do que longos" . A interpretação mais natural dessa frase está totalmente errada (e suponho que Barnett não pretendia implicar isso). Talvez eu devesse ser mais explícito sobre isso na minha resposta. Existe alguma parte substancial da minha resposta com a qual você discorda? Espero que não, pois concordo plenamente com o seu.
Ameba diz Reinstate Monica
13

O que o repórter está dizendo é que a ocorrência aleatória de uma queda de avião pode ser modelada como um processo de Poisson - uma situação em que a probabilidade de um evento ocorrer em algum (pequeno) intervalo é proporcional à duração do referido intervalo e em que cada ocorrência em Independente de todos os outros.

Esse é um modelo razoável para o cenário descrito?

Provavelmente.

Certamente, esses eventos podem não ser 100% independentes, pois outros pilotos provavelmente alteram seu comportamento (mesmo que ligeiramente) após um acidente. [Eu não sei - talvez alguns pilotos façam algum treinamento extra em simulador ou algo assim]. No entanto, a suposição de independência ainda é inteiramente razoável.

E quanto a grupos de acidentes de avião?

Sim. Dado um processo de Poisson (ou mesmo algum outro processo aleatório), você iria esperar para ver alguns clusters de ocorrências.

De fato, conforme descrito pelo Oxford Dictionary of Statistics em sua entrada para o Processo de Poisson (que é uma "descrição matemática da aleatoriedade"):

[R]andomness usually gives rise to apparent clustering, despite the natural
expectation that randomness would lead to regularity.

Por exemplo, confira este pequeno pedaço de código R :

set.seed(123)
x <- runif(500)
y <- runif(500)

plot(x, y, pch=20, col='blue', main="A Random Distribution of Points")

que produz:
Observe a aglomeração?

Embora saibamos que esse é um gráfico de pontos aleatórios, parece que existem alguns bits não- aleatórios - especificamente, em algumas partes do gráfico há grupos de pontos enquanto outras estão abertas. É esse mesmo tipo de comportamento que o artigo está tentando descrever (apenas com dados de séries temporais e não com dados espaciais ).


ATUALIZAR:

@ JoelW .: Então, por exemplo, digamos que a probabilidade de um avião cair amanhã (ou qualquer outro dia) seja " p " (e, digamos " p " seja algo como 1 em cem).

A razão pela qual a próxima queda de avião provavelmente ocorrerá amanhã mais do que em exatamente um ano (ou seja, em 26 de julho de 2015 ) é porque a probabilidade de a próxima queda ocorrer exatamente em um ano é igual a:

= Prob(crash tomorrow) * Prob(365 days with *no* crashes)

Faz sentido?

Em última análise, eu acho que a razão estas coisas são contra-intuitivo é porque normalmente quando pensamos em uma frase como: "The odds of a plane crash in one month compared with the odds of one happening tomorrow". Naturalmente, não consideramos imediatamente o período de 24 horas que começa em exatamente um mês. Em vez disso, nós (ou pelo menos eu penso) tendemos a pensar nisso de maneira mais flexível . Então, mais como: a month ± a week. Isso e o fato de nos esquecermos de levar em consideração as chances de um acidente não acontecer nesse meio tempo ... (Mas, novamente, talvez seja apenas eu ...).

Ufa!


Recursos adicionais:

  • Artigo da Wikipedia sobre a Ilusão de Cluster
  • Um pdf que menciona especificamente o "agrupamento" de acidentes de avião (na página 8) e descreve brevemente a matemática de um processo de Poisson .
Steve S
fonte
11
@ Joel W .: Na verdade, devo acrescentar mais a esta resposta - dê-me um par de minutos para editar ...
Steve S
7
O argumento para atrasar a viagem é o mesmo que aparece na piada antiga sobre como a TSA encontrou um estatístico com uma bomba a bordo de um avião. Quando perguntado se explicar, o estatístico disse: "Bem, as chances de uma pessoa com uma bomba são pequenos ainda não pequeno o suficiente para o conforto, mas as chances de duas pessoas tendo uma bomba são infinitesimais. Portanto, quando eu levar uma bomba, não há quase sem chance de haver duas bombas e estaremos perfeitamente seguros ".
whuber
11
Sua piada está no ponto, @whuber, mas parece haver algum tipo de desconexão lógica entre dizer que "intervalos curtos entre falhas são realmente mais prováveis ​​do que longas" e dizer que a probabilidade de uma falha amanhã é independente de uma falha ocorreu hoje. Eu acho que a probabilidade pode ser contra-intuitiva.
Joel W.
11
O que é contra-intuitivo (para mim) é dizer que eventos raros tendem a ocorrer perto do tempo. Intuitivamente, eu pensaria que eventos raros não ocorreriam perto no tempo. Eu sou o único com essa visão intuitiva?
Joel W.
11
@ Steve S: Obrigado pelo link. Como seria a distribuição exponencial do valor assumido na reportagem (1/365)? Em qualquer caso, talvez a Distribuição Exponencial não atenda ao título do artigo, o que implica uma comparação da probabilidade de um determinado número de eventos acontecer dentro de um curto período de tempo com a probabilidade desse número de eventos ocorrer dentro de um longo período de tempo. .
Joel W.
4

Se o número de acidentes de avião é distribuído por Poisson (como ele parece afirmar), o tempo entre acidentes tem uma distribuição exponencial. O pdf da distribuição exponencial é uma função monotônica decrescente do tempo. Portanto, falhas anteriores são mais prováveis ​​do que falhas posteriores.

Sid
fonte
"intervalos curtos entre colisões são, na verdade, mais prováveis ​​do que longos". Como isso é diferente de dizer que, se houve apenas um acidente de avião, todos devemos atrasar nossa próxima viagem (por razões estatísticas)?
Joel W.
2
Joel, essa citação não tem sentido até que o autor quantifique o que se entende por "curto" e "longo". No exemplo de um evento com uma taxa esperada de um por ano, a chance de recorrência durante o próximo mês ainda será muito menor do que a chance de que o próximo acidente ocorra mais de um ano depois. O que ele poderia querer dizer é que a probabilidade por unidade de tempo é maior no curto prazo do que no longo prazo. Para comparar probabilidades reais, é necessário multiplicar a probabilidade por unidade de tempo pela duração (tecnicamente, você deve integrá-la ao longo da duração).
whuber
@whuber: A manchete fala da probabilidade de um aglomerado de acidentes de avião. Até agora, nada dito sobre a troca de pilhas me convenceu de que um conjunto de acidentes de avião é mais comum ou provável do que acidentes de avião com espaçamento amplo. Então, parece-me que a citação da mídia é completamente enganosa (talvez porque os intervalos de tempo não sejam identificados, como você escreveu). O que você acha?
Joel W.Jul
Não sei o que você quer dizer com "acidentes de avião muito espaçados" nem, por sinal, tenho certeza absoluta do que você entende como "aglomerado". Suponha que, para tornar a situação concreta, ocorra uma série de eventos raros nos anos 0, 10, 11, 12 e 22 (contados a partir de alguma data inicial). Exatamente quantos eventos "amplamente espaçados" ocorreram? Quantos "aglomerados" ocorreram? Posso encontrar respostas defensáveis ​​para a primeira pergunta que variam de zero a dez e as respostas para a segunda pergunta podem ser zero ou uma.
whuber
11
@ whuber: A manchete indica que é mais provável que haja grupos de acidentes do que acidentes amplamente espaçados. Permite operacionalizar isso. Digamos que um cluster tenha 3 acidentes de avião e um curto período de tempo seja de 3 meses e um longo período de tempo seja de 3 anos. Parece ilógico pensar que há uma probabilidade mais alta de que três acidentes ocorram dentro de um período de 3 meses do que dentro de um período de 3 anos. Mesmo se considerarmos o primeiro acidente, é ilógico pensar que mais 2 acidentes ocorrerão nos próximos 3 meses, em comparação com os próximos 3 anos.
Joel W.
0

As outras respostas já trataram de como os eventos independentes se agrupam. (Ler o Caos de Gleick, todos esses anos atrás, abriu meus olhos para essa ideia.)

Mas, de fato, há fortes evidências de que acidentes de avião não são eventos independentes. A influência de Cialdini tem um capítulo muito bom sobre isso (também mencionado aqui, com alguns links para dados; e encontrei um trecho dessa parte do livro ). Obviamente, isso é altamente controverso: está basicamente dizendo que, quanto mais divulgado é um acidente aéreo, maior a probabilidade de influenciar um piloto (consciente ou inconscientemente) a derrubar seu avião. Mas as explicações psicológicas subjacentes à hipótese parecem plausíveis, e os dados parecem também apoiá-la.

(Os links para a pesquisa de desmistificação baseada em estatísticas serão bem-vindos, nos comentários.)

Darren Cook
fonte
Não diz o seguinte: diz "imediatamente após certos tipos de histórias de suicídio altamente divulgadas, o número de pessoas que morrem em acidentes de companhias aéreas comerciais aumenta".
Scortchi - Restabelece Monica
Creio que a referência para a alegação é Phillips, (1978) "As mortes por acidentes de avião aumentam logo após as notícias dos jornais sobre assassinato e suicídio", Science , 201 , pp 748-750. O resumo refere-se a "aviões particulares, de negócios e executivos corporativos".
Scortchi - Restabelecer Monica
Ou talvez este: Phillips (1980), "Acidentes de avião, assassinato e meios de comunicação de massa: rumo a uma teoria de imitação e sugestão", Social Forces , 58 , 4, onde "companhias aéreas" são mencionadas em resumo.
Scortchi - Reinstate Monica
2
Altheide (1981), Social Forces , 60 , 2 sugere que "um certo tipo de história de suicídio altamente divulgada" pode não ter sido definido de maneira totalmente independente das subsequentes quedas de avião - soa mais como a definição de "famoso rabino" .
Scortchi - Restabelece Monica