Essa é a maneira correta de atualizar continuamente uma probabilidade usando o Teorema de Bayes?

9

Digamos que estou tentando descobrir a probabilidade de que o sabor favorito de sorvete de alguém seja baunilha.

Eu sei que a pessoa também gosta de filmes de terror.

Quero descobrir a probabilidade de que o sorvete favorito da pessoa seja baunilha, já que eles gostam de filmes de terror.

Eu sei o seguinte:

  1. P ( A )5% das pessoas escolhem a baunilha como seu sabor favorito de sorvete. (Este é o meu )P(UMA)
  2. 10% das pessoas cujo favorito é sorvete de baunilha também adoram filmes de terror. (Este é o meu )P(B|UMA)
  3. 1 1% das pessoas cujo favorito não é sorvete de baunilha também adora filmes de terror (este é o meu )P(B|¬UMA)

Portanto, eu calculo da seguinte maneira: Acho que (arredondado para o décimo milésimo mais próximo). Há uma chance de que o sorvete preferido de um fã de filmes de terror seja baunilha. P(A|B)=0,344834,48%

P(UMA|B)=0,05×0,1(0,05×0,1)+(0,01×(1 1-0,05))
P(UMA|B)=0,344834,48%

Mas então soube que a pessoa assistiu a um filme de terror nos últimos 30 dias. Aqui está o que eu sei:

  1. 34,48% é a probabilidade posterior atualizada de que baunilha é o sabor favorito de sorvete da pessoa - o neste próximo problema.P(UMA)
  2. 20% das pessoas cujo favorito é sorvete de baunilha assistiram a um filme de terror nos últimos 30 dias.
  3. 5% das pessoas cujo favorito não é sorvete de baunilha assistiram a um filme de terror nos últimos 30 dias.

Isso fornece: quando arredondado.

0,3448×0,2(0,3448×0,2)+(0,05×(1 1-0,3448))=0.6779

Portanto, agora acredito que há uma chance de que o fã de filmes de terror adora sorvete, já que assistiu a um filme de terror nos últimos 30 dias.67,79%

Mas espere, há outra coisa. Eu também aprendi que a pessoa possui um gato.

Aqui está o que eu sei:

  1. 67,79% é a probabilidade posterior atualizada de que baunilha é o sabor favorito de sorvete da pessoa - o neste próximo problemaP(UMA)
  2. 40.% das pessoas cujo favorito é sorvete de baunilha também possui gatos
  3. 10% das pessoas cujo favorito não é sorvete de baunilha também possuem gatos

Isso fornece: quando arredondado.

0.6779×0,4(0.6779×0,4)+(0,1×(1 1-0.6779))=0,8938

Minha pergunta se resume basicamente a isso: estou atualizando corretamente a probabilidade usando o teorema de Bayes? Estou entendendo algo errado nos meus métodos?

user1626730
fonte
11
amor = favorito? você não está postando graus de amor. se você o ama, é o seu favorito. esclareça se necessário.
generic_user
Bom ponto. Mudei "amor" para "favorito". Não é gramaticalmente correto, mas é menos prolixo do que dizer "escolha baunilha para o seu sabor favorito de sorvete". Espero que isso esclareça as coisas.
user1626730

Respostas:

7

Isto não está correto. A atualização seqüencial desse tipo funciona apenas quando as informações que você está recebendo sequencialmente são independentes (por exemplo, observações de uma variável aleatória). Se cada observação não for independente, como neste caso, você precisará considerar a distribuição de probabilidade conjunta. A maneira correta de atualizar seria voltar ao anterior, encontrar a probabilidade conjunta de que alguém adora filmes de terror, tenha assistido a um filme de terror nos últimos 30 dias e seja dono de um gato, pois escolhe ou não a baunilha como sabor de sorvete favorito e, em seguida, atualize em uma única etapa.

Atualizar sequencialmente assim quando seus dados não são independentes rapidamente conduzirá sua probabilidade posterior muito mais alta ou mais baixa do que deveria.

Jonathan Christensen
fonte
11
Como você quer dizer com "quando as informações que você está recebendo sequencialmente são independentes?" Se você quer dizer "independente do evento que está tentando prever", sabe como posso saber se as informações que estou recebendo são independentes?
user1626730
Condicionalmente independente, dado o evento que você está tentando prever. Se eles fossem independentes do evento que você está tentando prever, eles não fariam nenhum bem. Quanto a como você pode saber - você precisa pensar sobre quais são seus dados. Nesse caso, se alguém assistiu a um filme de terror nos últimos 30 dias claramente não é independente de gostar de filmes de terror.
Jonathan Christensen
Quando você diz "independente condicional", acho que você quer dizer que cada P (B) (ou seja, amante de filmes de terror e propriedade de gatos) não está relacionado um ao outro? Se sim, a variável propriedade do gato não seria independente do amor pelo filme de terror?
user1626730
Sim, você pode argumentar que a posse de um gato é independente do amor pelo filme de terror. Porém, não é necessariamente - por exemplo, talvez as mulheres tenham mais chances de amar gatos e menos de filmes de terror.
Jonathan Christensen
Hm, não sei bem o que você quer dizer com adicionar um pouco sobre mulheres e gatos. Você poderia explicar mais, por favor?
user1626730