Atualização bayesiana - exemplo de lançamento de moeda

7

Eu tenho uma pergunta sobre a atualização bayesiana. Em geral, a atualização bayesiana refere-se ao processo de obter o posterior de uma distribuição anterior de crenças.

Alternativamente, pode-se entender o termo usando a parte posterior do primeiro passo como entrada anterior para cálculos adicionais.

A seguir, é apresentado um exemplo simples de cálculo. O método a é o cálculo padrão. O método b usa a saída posterior como entrada antes para calcular o próximo posterior.

Usando o método a, obtemos P (F | HH) = 0,2. Usando o método b, obtém-se P (F | HH) = 0,05. Minha pergunta é até que ponto o método b é uma abordagem válida?


Problema: Você joga uma moeda duas vezes e ganha 2 cabeças. Qual é a probabilidade de a moeda ser justa, ou seja,Pr(Fair coin|HH)?

Agora, para o primeiro sorteio: Pr(Fair coin|H)=Pr(Head|Fair)P(Fair)Pr(Head|Fair)P(Fair)+Pr(Head|Biased)P(Biased)=Pr(H|F)P(F)P(H)(1)

Supondo que a crença anterior inicial P (Justa) = 0,5, queira encontrar P (F | H) para o primeiro sorteio

Abaixo está o cálculo para as etapas intermediárias:

P(H|F)=(nx)θx(1θ)nx=(11)0.51(0.5)0=0.5

P(H)=P(H|F)P(F)+P(H|Biased)P(Biased)=(0.50.5)+(10.5)=0.75

(Nota: P (H | tendencioso) = 1 porque, assumindo um exemplo extremo com as cabeças nos dois lados da moeda, a probabilidade de obter cabeças com uma moeda tendenciosa = 1 (facilita o cálculo))

Portanto, conectando-se a (1), obtemos:

Pr(F|H)=Pr(H|F)P(F)P(H)=0.50.50.75=0.33


Agora, jogamos a moeda novamente e obtemos outro H. Para calcular , nósPr(F|HH)

a) continue usando P (razoável) = 0,5

Pr(F|HH)=Pr(HH|F)P(F)Pr(HH|F)P(F)+Pr(HH|Biased)P(Biased)=Pr(HH|F)P(F)P(HH)(2)

P(HH|F)=(nx)θx(1θ)nx=(22)0.52(0.5)0=0.25

P(HH)=P(HH|F)P(F)+P(HH|Biased)P(Biased)=(0.250.5)+(10.5)=0.625

Portanto, conectando-se a (2), Pr(F|HH)=Pr(HH|F)P(F)P(HH)=0.250.50.625=0.2


Como alternativa, e se calcularmos usandoPr(F|HH)

b) nossa crença atualizada P (Justo) = 0,33 que obtivemos de Pr (F | H) no primeiro passo

Nesse caso,

P(HH|F)=(nx)θx(1θ)nx=(22)0.332(10.33)0=0.1089

P(HH)=P(HH|F)P(F)+P(HH|Biased)P(Biased)=(0.10890.33)+(10.67)=0.705937

Portanto, conectando-se a (2), Pr(F|HH)=Pr(HH|F)P(F)P(HH)=0.10890.330.705937=0.05091


Usando o método a, obtemos P (F | HH) = 0,2. Usando o método b, obtém-se P (F | HH) = 0,05. Minha pergunta é até que ponto o método b é uma abordagem válida?

TinaW
fonte
Como você concluiu que a probabilidade de obter cara dada uma moeda tendenciosa é 1? De qualquer forma, não importa quantas vezes você jogue a moeda, a probabilidade de que ela seja justa é zero.
Neil G
Se a moeda é tendenciosa e vemos uma Cabeça, significa que a moeda tem Cabeça nos dois lados. Sempre veremos o Head, então a probabilidade de obter o Head com uma moeda tendenciosa = 1.
TinaW
11
Normalmente, uma moeda tendenciosa significa apenas que não é justa, mas pode ter qualquer tendência. Você deve deixar claro em sua pergunta que está apenas considerando as possibilidades de que a moeda seja perfeitamente justa, ou então sempre surge na cabeça. Você pode reformular isso como um problema de urna, pois não é uma moeda muito realista.
Neil G
11
"De fato, uma moeda é totalmente justa ou totalmente tendenciosa." - Na verdade não. Existem muito poucas moedas que sejam totalmente justas ou "totalmente tendenciosas".
Neil G
11
cabeças de ambos os lados
TinaW 5/11

Respostas:

11

Sua abordagem b) está errada: a atualização de etapa única , na qual todos os dados são usados ​​juntos para atualizar o anterior e chegar ao posterior, e a atualização seqüencial bayesiana (também chamada de recursiva ) , na qual os dados são usados ​​um de cada vez. para obter um posterior que se torna o anterior da iteração sucessiva, deve fornecer exatamente o mesmo resultado. Este é um dos pilares da estatística bayesiana: consistência .

Seu erro é simples: depois de atualizar o anterior com a primeira amostra (o primeiro "cabeçalho"), você terá apenas uma amostra restante para incluir na sua probabilidade, a fim de atualizar o novo anterior. Nas fórmulas:

P(F|HH)=P(H|H,F)P(F|H)P(H|H)

Essa fórmula é apenas o teorema de Bayes, aplicado após o primeiro evento "Head" já ter acontecido: como as probabilidades condicionais são probabilidades, o teorema de Bayes também é válido para probabilidades condicionadas ao evento "Head", e não há mais nada a provar realmente . No entanto, descobri que algumas vezes as pessoas não acham esse resultado evidente, portanto, dou uma prova um pouco demorada.

P(F|HH)=P(HH|F)P(F)P(HH)=P(H|H,F)P(H|F)P(F)P(HH)

pela regra da cadeia de probabilidades condicionais. Então, multiplicando o numerador e o denominador por , você obtémP(H)

P(H|H,F)P(H|F)P(F)P(HH)=P(H|H,F)P(H|F)P(F)P(H)P(HH)P(H)=P(H|H,F)P(H)P(HH)P(H|F)P(F)P(H)=P(H|H,F)P(H|H)P(H|F)P(F)P(H)=P(H|H,F)P(F|H)P(H|H)

onde no último passo eu apenas apliquei o teorema de Bayes. Agora:

P(H|H,F)=P(H|F)=0.5

Isso é óbvio: condicionalmente, com a moeda sendo justa (ou tendenciosa), estamos modelando os lançamentos da moeda como iid. Aplicando essa mesma idéia ao denominador, obtemos:

P(H|H)=P(H|F,H)P(F|H)+P(H|B,H)P(B|H)=P(H|F)P(F|H)+P(H|B)P(B|H)=0.50.3¯+10.6¯

Finalmente:

P(F|HH)=P(H|H,F)P(F|H)P(H|H)=0.50.3¯0.50.3¯+10.6¯=0.2

QED


É isso: divirta-se usando a atualização sequencial bayesiana, é muito útil em muitas situações! Se você quiser saber mais, existem muitos recursos na Internet: isso é muito bom.

DeltaIV
fonte