Como aplicar o teorema de Bayes na busca de um pescador perdido no mar

19

O artigo The Odds, Continued Updated menciona a história de um pescador de Long Island que literalmente deve sua vida às estatísticas Bayesianas. Aqui está a versão curta:

Há dois pescadores em um barco no meio da noite. Enquanto um está dormindo, o outro cai no oceano. O barco continua a andar no piloto automático durante toda a noite até o primeiro cara finalmente acordar e notificar a Guarda Costeira. A Guarda Costeira usa um software chamado SAROPS (Sistema de Planejamento Ótimo de Busca e Resgate) para encontrá-lo bem a tempo, pois estava hipotérmico e sem energia para se manter à tona.

Aqui está a versão longa: Um pontinho no mar

Eu queria saber mais sobre como o teorema de Bayes é realmente aplicado aqui. Eu descobri um pouco sobre o software SAROPS apenas pesquisando no Google.

O simulador SAROPS

O componente do simulador leva em consideração dados oportunos, como corrente oceânica, vento, etc. e simula milhares de possíveis caminhos de deriva. A partir desses caminhos de deriva, um mapa de distribuição de probabilidade é criado.

Observe que os gráficos a seguir não se referem ao caso do pescador desaparecido que mencionei acima, mas são um exemplo de brinquedo retirado desta apresentação

Mapa de Probabilidades 1 (Vermelho indica a maior probabilidade; azul, a menor) insira a descrição da imagem aqui

Observe o círculo que é o local inicial.

Mapa de Probabilidades 2 - Mais tempo se passou insira a descrição da imagem aqui

Observe que o mapa de probabilidade se tornou multimodal. Isso ocorre porque neste exemplo, vários cenários são contabilizados:

  1. A pessoa está flutuando na água - modo meio-alto
  2. A pessoa está em uma balsa salva-vidas (mais afetada pelo vento vindo do norte) - dois modos inferiores (divididos por causa dos "efeitos de escoriações")

Mapa de probabilidades 3 - A pesquisa foi conduzida pelos caminhos retangulares em vermelho insira a descrição da imagem aqui Esta imagem mostra os caminhos ideais produzidos pelo planejador (outro componente do SAROPS). Como você pode ver, esses caminhos foram pesquisados ​​e o mapa de probabilidades foi atualizado pelo simulador.

p(fail)

Efeitos de uma pesquisa malsucedida

É aqui que entra o Teorema de Bayes. Depois que uma pesquisa é realizada, o mapa de probabilidades é atualizado de acordo para que outra pesquisa possa ser planejada da melhor maneira possível.

Depois de revisar o Teorema de Bayes na wikipedia e no artigo Uma explicação intuitiva (e curta) do Teorema de Bayes em BetterExplained.com

Peguei a equação de Bayes:

P(AX)=P(XA)×P(A)P(X)

E definiu A e X da seguinte maneira ...

  • Evento A: A pessoa está nesta área (célula da grade)

  • Teste X: pesquisa malsucedida nessa área (célula da grade), ou seja, pesquisou nessa área e não viu nada

Produzindo,

P(person thereunsuccessful)=P(unsuccessfulperson there)×P(person there)P(unsuccessful)

P(fail)P(fail)

Então agora nós temos,

P(person thereunsuccessful)=P(fail)×P(person there)P(unsuccessful)
  1. A equação de Bayes é aplicada corretamente aqui?

  2. Como seria calculado o denominador, a probabilidade de uma pesquisa malsucedida?

    Também no Search and Rescue Optimal Planning System , eles dizem

    As probabilidades anteriores são "normalizadas da maneira bayesiana usual" para produzir as probabilidades posteriores

  3. O que significa "normalizado da maneira bayesiana normal" ?

    P(unsuccessful)

  4. P(person there)P(person thereunsuccessful)

Mais uma nota de simplificação - de acordo com o Sistema de Planejamento Ideal de Busca e Salvamento, a distribuição posterior é realmente calculada atualizando as probabilidades dos caminhos de desvio simulados e, em seguida, gerando novamente o mapa de probabilidades com grade. Para manter esse exemplo simples, escolhi ignorar os caminhos do sim e focar nas células da grade.

mlai
fonte

Respostas:

6
  1. Assumindo independência entre as células da grade, parece que o Teorema de Bayes foi aplicado corretamente.
  2. P(X)=P(X|A)P(A)+P(X|Ac)P(Ac)
    AcAP(X|Ac)=1
  3. P(A|X)
    P(A|X)P(X|A)P(A)P(Ac|X),P(X|Ac)P(Ac), and P(A|X)+P(Ac|X)=1
    P(X)
  4. iAiiXiiX

    • iP(Ai|X)=1
    • P(Ai|X)=P(Ai|Xi)P(Xi|Ai)P(Ai)P(Ai|X)P(Ai)P(Ai|X)

    P(Ai|X)

jaradniemi
fonte
iP(Ai|X)=1P(X|A)P(A)iP(X|A)P(Ai)
Eu só percebi que a procura cada célula com uma probabilidade fixa de falha resultaria em absolutamente nenhuma mudança entre a distribuição de probabilidade :)
mlai
P(X|A)P(Ai)P(Ai)
4

Fui apontado para um livro que tem um capítulo inteiro dedicado à minha pergunta - Análise de Operações Navais - por um ex-professor que costumava ser piloto de helicóptero e, na verdade, realizou missões de busca e resgate!

No capítulo 8, é fornecido um exemplo semelhante a este (eu o personalizei um pouco):

Para começar, há uma distribuição prévia em grade para a localização da (s) pessoa (s) desaparecida (s), barco etc.

Distribuição prévia: Distribuição prévia

Uma pesquisa é realizada em parte da grade e as probabilidades são atualizadas com uma distribuição posterior normalizada , aplicando a equação de Bayes da mesma maneira que mencionei nas minhas perguntas:

P(target in (i,j)no detection)=P(no detectiontarget in (i,j))×P(target in (i,j))P(no detection)

onde (i, j) = (lat, long)

Nesse caso, decidi pesquisar a coluna 3 porque essa coluna tinha a maior probabilidade total anterior .

Distribuição posterior normalizada após pesquisa na terceira coluna com pFail = 0,2: Distribuição posterior normalizada (com probabilidade de falha = 0,2)

Minha pergunta era principalmente sobre como a posterior foi normalizada. Eis como foi feito no livro - simplesmente divida cada probabilidade posterior individual pela soma total , S :

Descrição da imagem

Escolhi uma probabilidade de 0,2 de uma pesquisa com falha porque meu professor tinha a dizer: "Nós pesquisamos apenas 80% de probabilidade de detecção, porque essa é geralmente a melhor alternativa entre timlieness e precisão".

Apenas para chutes, executei outro exemplo com um pFail de 0,5. Enquanto no primeiro exemplo ( pFail = 0,2), a próxima melhor rota de pesquisa (considerando as pesquisas posteriores normalizadas e assumindo linhas retas, sem diagonal ou zig-zag) seria sobrevoar a coluna 2, no segundo exemplo ( pFail = 0.5) a melhor rota seguinte é sobre a linha 2.

Distribuição posterior normalizada após pesquisa na terceira coluna com pFail = 0,5: Distribuição posterior normalizada (com probabilidade de falha = 0,5)

insira a descrição da imagem aqui

Ele também acrescentou: "A aeronave carrega uma pequena lista de verificação com eles para ajudar a determinar a melhor altitude e velocidade do ar. Trabalhar isso em um helicóptero voador é como sentar em cima de uma máquina de lavar roupa, lendo um livro colado em uma máquina de lavar roupa diferente".

mlai
fonte