Digamos que estou tentando descobrir a probabilidade de que o sabor favorito de sorvete de alguém seja baunilha.
Eu sei que a pessoa também gosta de filmes de terror.
Quero descobrir a probabilidade de que o sorvete favorito da pessoa seja baunilha, já que eles gostam de filmes de terror.
Eu sei o seguinte:
- P ( A ) das pessoas escolhem a baunilha como seu sabor favorito de sorvete. (Este é o meu )
- das pessoas cujo favorito é sorvete de baunilha também adoram filmes de terror. (Este é o meu )
- das pessoas cujo favorito não é sorvete de baunilha também adora filmes de terror (este é o meu )
Portanto, eu calculo da seguinte maneira: Acho que (arredondado para o décimo milésimo mais próximo). Há uma chance de que o sorvete preferido de um fã de filmes de terror seja baunilha. P(A|B)=0,344834,48%
Mas então soube que a pessoa assistiu a um filme de terror nos últimos 30 dias. Aqui está o que eu sei:
- é a probabilidade posterior atualizada de que baunilha é o sabor favorito de sorvete da pessoa - o neste próximo problema.
- das pessoas cujo favorito é sorvete de baunilha assistiram a um filme de terror nos últimos 30 dias.
- das pessoas cujo favorito não é sorvete de baunilha assistiram a um filme de terror nos últimos 30 dias.
Isso fornece: quando arredondado.
Portanto, agora acredito que há uma chance de que o fã de filmes de terror adora sorvete, já que assistiu a um filme de terror nos últimos 30 dias.
Mas espere, há outra coisa. Eu também aprendi que a pessoa possui um gato.
Aqui está o que eu sei:
- é a probabilidade posterior atualizada de que baunilha é o sabor favorito de sorvete da pessoa - o neste próximo problema
- das pessoas cujo favorito é sorvete de baunilha também possui gatos
- das pessoas cujo favorito não é sorvete de baunilha também possuem gatos
Isso fornece: quando arredondado.
Minha pergunta se resume basicamente a isso: estou atualizando corretamente a probabilidade usando o teorema de Bayes? Estou entendendo algo errado nos meus métodos?
fonte
Respostas:
Isto não está correto. A atualização seqüencial desse tipo funciona apenas quando as informações que você está recebendo sequencialmente são independentes (por exemplo, observações de uma variável aleatória). Se cada observação não for independente, como neste caso, você precisará considerar a distribuição de probabilidade conjunta. A maneira correta de atualizar seria voltar ao anterior, encontrar a probabilidade conjunta de que alguém adora filmes de terror, tenha assistido a um filme de terror nos últimos 30 dias e seja dono de um gato, pois escolhe ou não a baunilha como sabor de sorvete favorito e, em seguida, atualize em uma única etapa.
Atualizar sequencialmente assim quando seus dados não são independentes rapidamente conduzirá sua probabilidade posterior muito mais alta ou mais baixa do que deveria.
fonte