Eu tenho uma pergunta sobre a atualização bayesiana. Em geral, a atualização bayesiana refere-se ao processo de obter o posterior de uma distribuição anterior de crenças.
Alternativamente, pode-se entender o termo usando a parte posterior do primeiro passo como entrada anterior para cálculos adicionais.
A seguir, é apresentado um exemplo simples de cálculo. O método a é o cálculo padrão. O método b usa a saída posterior como entrada antes para calcular o próximo posterior.
Usando o método a, obtemos P (F | HH) = 0,2. Usando o método b, obtém-se P (F | HH) = 0,05. Minha pergunta é até que ponto o método b é uma abordagem válida?
Problema: Você joga uma moeda duas vezes e ganha 2 cabeças. Qual é a probabilidade de a moeda ser justa, ou seja,?
Agora, para o primeiro sorteio:
Supondo que a crença anterior inicial P (Justa) = 0,5, queira encontrar P (F | H) para o primeiro sorteio
Abaixo está o cálculo para as etapas intermediárias:
(Nota: P (H | tendencioso) = 1 porque, assumindo um exemplo extremo com as cabeças nos dois lados da moeda, a probabilidade de obter cabeças com uma moeda tendenciosa = 1 (facilita o cálculo))
Portanto, conectando-se a (1), obtemos:
Agora, jogamos a moeda novamente e obtemos outro H. Para calcular , nós
a) continue usando P (razoável) = 0,5
Portanto, conectando-se a (2),
Como alternativa, e se calcularmos usando
b) nossa crença atualizada P (Justo) = 0,33 que obtivemos de Pr (F | H) no primeiro passo
Nesse caso,
Portanto, conectando-se a (2),
Usando o método a, obtemos P (F | HH) = 0,2. Usando o método b, obtém-se P (F | HH) = 0,05. Minha pergunta é até que ponto o método b é uma abordagem válida?
Respostas:
Sua abordagem b) está errada: a atualização de etapa única , na qual todos os dados são usados juntos para atualizar o anterior e chegar ao posterior, e a atualização seqüencial bayesiana (também chamada de recursiva ) , na qual os dados são usados um de cada vez. para obter um posterior que se torna o anterior da iteração sucessiva, deve fornecer exatamente o mesmo resultado. Este é um dos pilares da estatística bayesiana: consistência .
Seu erro é simples: depois de atualizar o anterior com a primeira amostra (o primeiro "cabeçalho"), você terá apenas uma amostra restante para incluir na sua probabilidade, a fim de atualizar o novo anterior. Nas fórmulas:
Essa fórmula é apenas o teorema de Bayes, aplicado após o primeiro evento "Head" já ter acontecido: como as probabilidades condicionais são probabilidades, o teorema de Bayes também é válido para probabilidades condicionadas ao evento "Head", e não há mais nada a provar realmente . No entanto, descobri que algumas vezes as pessoas não acham esse resultado evidente, portanto, dou uma prova um pouco demorada.
pela regra da cadeia de probabilidades condicionais. Então, multiplicando o numerador e o denominador por , você obtémP(H)
onde no último passo eu apenas apliquei o teorema de Bayes. Agora:
Isso é óbvio: condicionalmente, com a moeda sendo justa (ou tendenciosa), estamos modelando os lançamentos da moeda como iid. Aplicando essa mesma idéia ao denominador, obtemos:
Finalmente:
QED
É isso: divirta-se usando a atualização sequencial bayesiana, é muito útil em muitas situações! Se você quiser saber mais, existem muitos recursos na Internet: isso é muito bom.
fonte