Essa pode ser uma pergunta elementar e é por isso que não consegui encontrá-la no Stackexchange ou no Mathoverflow, mas estou tendo problemas com a aritmética envolvida na atualização de probabilidades usando o teorema de Bayes para um problema no qual estou trabalhando.
Fundo:
Estou tentando fornecer previsões de probabilidade para eventos futuros que não têm ou têm poucos precedentes. Ao contrário da maioria da literatura e textos de Bayes, que usam distribuições conhecidas anteriormente para fornecer probabilidades de eventos futuros dentro de parâmetros semelhantes - minha situação é baseada na opinião de especialistas apenas com poucas ou nenhuma distribuição razoável para referência.
Exemplo:
A GM anunciou que está desenvolvendo um carro novo, mas não disse quando seria lançado. O gerente de produção da KIA precisa saber quando estará pronto para liberá-lo para poder liberar seu carro novo na mesma época.
A KIA sabe que o novo carro precisa dos seguintes componentes para estar pronto para o lançamento (1) do motor, (2) transmissão, (3) carroceria, (4) Rodas e suspensão. Os engenheiros experientes da KIA afirmam que, para um novo projeto como esse, eles têm 90% de confiança de que ele poderá ser concluído em dois anos. A KIA também descobriu que a GM fez um teste com a nova transmissão em outro SUV e funcionou como projetado com uma taxa de sucesso de 95%. Os mesmos engenheiros afirmaram que, dado esse teste de transmissão, um carro pode ser concluído dentro desse prazo em 70% do tempo.
Do jeito que eu tenho, neste momento o KIA pode iniciar o cálculo bayesiano com a amostra inicial como abaixo:
A = GM will release the new car in two years
B1 = GM will successfully test a new transmission
P(A) = Prior Probability that GM will release the new car in two years
P(B1) = Probability that GM will successfully test a new transmission
P(B1|A) = Likelihood that given a successful transmission test, the car will be released within 2 years
Atribuindo valores da seguinte maneira
P(A) = .9
P(B1) = .95
P(B1|A) = .7
Logo após o departamento de estatística da KIA fazer essa atualização, a GM anunciou que havia testado seu novo mecanismo e que tinha uma taxa de sucesso de 98% em todos os seus testes. Os engenheiros da KIA disseram que, normalmente, se houver um teste bem-sucedido do motor, há uma probabilidade de 80% de que um carro seja concluído no prazo - mas eles não sabiam qual era a probabilidade no tempo de conclusão geral, tanto o motor quanto o motor. teste de transmissão foi.
Os valores agora do nosso segundo fragmento de evidência, que deve ser observado, são independentes para este caso - mas não são, em todos os casos, por exemplo, o corpo deve continuar após a suspensão:
P(B2) = .98
P(B2|A) = .8
Então, aqui é onde estou tendo problemas: integrar aritmeticamente o P (A | B1) posterior no cálculo de P (A | B1, B2), considerando que os anteriores devem permanecer constantes. Como mencionei, alguns eventos dentro de { } são independentes, outros são condicionais.
Eu vi a entrada da wikipedia que descreve três extensões de bayes de eventos:
no entanto, que tal uma quarta e quinta extensão?
A maioria dos livros e recursos on-line que tenho não mostra as etapas para atualizar os anteriores de qualquer maneira que eu possa discriminar. Pode ser que eu esteja muito longe dos meus dias de cálculo na graduação para interpretá-lo, mas meu medo é que eu precise ter uma experiência significativa em teoria dos conjuntos e matemática em nível de pós-graduação para fazer o que parece ser um cálculo simples. Essa troca é a mais próxima que pude encontrar e, mesmo assim, ela não passa por ela. O fato de eu não ter, após uma semana de pesquisa, encontrado um tutorial básico sobre a mecânica da atualizaçãoO teorema de Bayes (não importa o que seja e como ele funciona - há mais do que suficiente) além da primeira implementação, me faz pensar que não é um cálculo trivial. Existe uma maneira simples de fazer essa atualização sem matemática no nível de pós-graduação?
Nota: Estou ciente da ironia relacionada à dificuldade inerente ao "problema de atualização" do WRT Bayes, pois Yudkowski vem discutindo isso há algum tempo. Eu estava assumindo, talvez incorretamente, que aqueles que estavam trabalhando nele estavam fazendo referência a iterações muito mais complexas, mas estou ciente de que poderia ser o caso em que estou enfrentando esse problema.
Existem várias maneiras de estender esse resultado. A forma geral é que Existem várias maneiras de escrever numerador e denominador. Seu formulário dá dois exemplos (assumindo que e são a mesma coisa). Obviamente, para um determinado problema, você deve formular o LHS escrevendo o RHS em termos de quantidades que realmente conhece; se isso pode ser feito para o seu problema específico provavelmente vale uma pergunta mais específica neste site.
Quando as variáveis ( ) etc. são contínuas, o cálculo da posterior fica realmente muito mais complicado, na maioria dos problemas, e são necessárias técnicas matemáticas / estatísticas de nível de pós-graduação.A,B,C,D
fonte