Teorema de Bayes modificado pelo XKCD: realmente razoável?

81

Eu sei que isso é de uma história em quadrinhos famosa por tirar proveito de certas tendências analíticas , mas na verdade parece razoável depois de alguns minutos de encarar. Alguém pode descrever para mim o que esse " teorema de Bayes modificado " está fazendo?

eric_kernfeld
fonte
4
explanxkcd.com/wiki/index.php/2059:_Modified_Bayes%27_Theorem a explicação do autor.
Tschallacka 16/10
50
@Tschallacka O que faz você pensar que Randall escreveu isso?
kasperd
16
@Tschallacka, a menos que algum dos autores seja o próprio Randall, esse não é o caso.
SQB 16/1018
Mas você não deveria aplicar o teorema de Bayes a P (C) para atualizar seu valor diante de mais evidências?
Yakk
1
P(C)

Respostas:

107

P(H)

P(H|X)=P(X|H)P(H)P(X)P(C)+P(H)[1-P(C)],
C=H

Suponho que isso seja uma tréplica contra as críticas de que, em princípio, os bayesianos podem ajustar o anterior para apoiar qualquer conclusão que desejem, enquanto os bayesianos argumentariam que não é assim que as estatísticas bayesianas realmente funcionam.

(E sim, você conseguiu me fazer um nerd furtivo . Não sou nem um matemático nem um físico, então não tenho certeza de quantos pontos valho.)

tddevlin
fonte
60
Uma piada inteligente incorporada na fórmula acima é que, se você não estiver usando as estatísticas bayesianas corretamente, sua inferência é completamente independente da verdade.
Cliff AB
25
Espero que você não tenha digitado sua resposta ao atravessar uma rua movimentada. Eu não vou fazer parte disso ...
eric_kernfeld 16/10
6
O tipo de Bayesians carricatured acima não é estatística bayesiana, eles são advogados bayesiana
Kjetil b Halvorsen
4
@CliffAB Não sei se chamaria isso de uma piada inteligente ou uma lei da natureza.
Eric_kernfeld
7
@CLiffAB Você quer dizer "O seu posterior (calculado por esta fórmula) é independente da evidência"?
Acumulação
31

Acredite ou não, esse tipo de modelo aparece de vez em quando em modelos estatísticos muito sérios, especialmente quando se trata de fusão de dados, ou seja, tentando combinar inferência de vários sensores tentando fazer inferência em um único evento.

UMABUMAé verdade (ou seja, a probabilidade posterior de que esse sensor falhe muito torna-se muito alta quando percebemos que contradiz todos os outros sensores). Se a distribuição de falha for independente do parâmetro em que queremos inferir, se a probabilidade posterior de falha for alta, as medidas desse sensor terão muito pouco efeito na distribuição posterior do parâmetro de interesse; de fato, independência se a probabilidade posterior de falha for 1.

Esse é um modelo geral que deve ser considerado quando se trata de inferência, ou seja, devemos substituir o teorema de Bayes pelo teorema de Bayes modificado ao fazer estatísticas bayesianas? Não. O motivo é que "o uso correto das estatísticas bayesianas" não é realmente apenas binário (ou, se for, é sempre falso). Qualquer análise terá graus de suposições incorretas. Para que suas conclusões sejam completamente independentes dos dados (implícitos na fórmula), é necessário cometer erros extremamente graves. Se "usar estatísticas bayesianas incorretamente" em qualquer nível significasse que sua análise era completamente independente da verdade, o uso de estatísticas seria totalmente inútil. Todos os modelos estão errados, mas alguns são úteis e tudo mais.

Cliff AB
fonte
5
Acho que tivemos sorte em descobrir que o modo de falha estática de nossos sensores é um extremo ou outro. O esmagamento de ruído é muito mais difícil. É realmente irritante descobrir que o sensor está funcionando corretamente e o valor recebido está errado porque o fio está agindo como uma antena.
Joshua
@ Joshua, espero que algum dia eu tenha tempo para aprender adequadamente a filtragem Kalman para esse tipo de situação (ou talvez alguém escreva uma resposta brilhante do SE que torne tudo claro?).
mbrig
μEuN(umaEuμ,1)t(df=10)Eu
Cliff AB