Problema de Monty Hall com um Monty falível

23

Monty sabia perfeitamente se a Porta tinha uma cabra atrás dela (ou estava vazia). Este fato permite ao jogador dobrar sua taxa de sucesso ao longo do tempo, trocando "palpites" para a outra porta. E se o conhecimento de Monty fosse menos que perfeito? E se, às vezes, o prêmio realmente estivesse na mesma porta que a cabra? Mas você não pôde vê-lo até depois de escolher e abrir SUA porta? Você pode me ajudar a entender como calcular se - e em quanto - o jogador pode melhorar seu sucesso quando a taxa de precisão de Monty é inferior a 100%? Por exemplo: e se Monty estiver errado - em média 50% do tempo? O jogador AINDA pode se beneficiar da troca de palpite / porta? Imagino que se Monty tiver menos de 33,3% de chance de estar correto que o prêmio NÃO esteja atrás da porta, a melhor opção do jogador é NÃO mudar sua opção de porta. Você pode, por favor, fornecer uma maneira de calcular o benefício potencial da troca, inserindo diferentes Probabilidades de Monty estar Correto sobre o Prêmio NÃO estar atrás da Porta? Não tenho nada além da matemática do ensino médio e tenho 69 anos, então, por favor, seja gentil.


Obrigado pelas informações e fórmulas fornecidas. Parece que se "Fallible Monty" tiver apenas 66% de precisão na previsão da ausência de um Prêmio / Carro, haverá ZERO benefício em mudar da sua escolha original de portas .... porque a taxa de erro de 33% é o padrão taxa básica para o Prêmio estar atrás de QUALQUER porta. Supõe-se, no entanto, que, se Monty fica melhor que 66% ao prever onde NÃO HÁ PRÊMIO, a comutação obtém maior utilidade. Tentarei aplicar esse raciocínio a um jogo em que um "especialista" faz uma "previsão de especialista" de que uma das três opções aproximadamente igualmente prováveis ​​será a correta. Tenho pouca fé no especialista estar correto e tenho certeza de que a "taxa de acertos" será menor que 33% - mais ou menos 15%. Minha conclusão disso será que quando o "mesma opção que eu, provavelmente estou errado com certeza e devo mudar para um dos outros dois! ;-)

Pseudoego
fonte
5
Se a precisão de Monty é inferior a 100%, isso significa que ele às vezes abre a porta com o prêmio por trás? Se assim for, você provavelmente deve escolher essa porta.
Fax

Respostas:

35

Vamos começar com o problema regular de Monty Hall. Três portas, atrás de uma delas é um carro. Os outros dois têm cabras atrás deles. Você escolhe a porta número 1 e Monty abre a porta número 2 para mostrar que há uma cabra atrás dela. Você deve mudar seu palpite para a porta número 3? (Observe que os números que usamos para nos referir a cada porta não importam aqui. Poderíamos escolher qualquer ordem e o problema é o mesmo; portanto, para simplificar, podemos simplesmente usar essa numeração.)

A resposta, claro, é sim, como você já sabe, mas vamos fazer os cálculos para ver como eles mudam mais tarde. Seja C o índice da porta do carro e M denote o evento em que Monty revelou que a porta 2 tem uma cabra. Precisamos calcular p(C=3|M) . Se este for maior do que 1/2 , precisamos mudar nosso palpite para essa porta (uma vez que só tem duas opções restantes). Essa probabilidade é dada por:

p(C=3|M)=p(M|C=3)p(M|C=1)+p(M|C=2)+p(M|C=3)
(Isso está apenas aplicando a regra de Bayes com um plano anterior aC)p(M|C=3)é igual a 1: se o carro está atrás da porta número 3, Monty não teve escolha a não ser abrir a porta número 2 como ele fez. p(M|C=1)é igual a1/2 : se o carro estiver atrás da porta 1, Monty poderá abrir uma das portas restantes, 2 ou 3.p(M|C=2) é igual a 0, porque Monty nunca abre a porta que ele sabe ter. carro. Preenchendo esses números, obtemos:
p(C=3|M)=10.5+0+1=23
Qual é o resultado com o qual estamos familiarizados.

Agora vamos considerar o caso em que Monty não tem conhecimento perfeito de qual porta possui o carro. Então, quando ele escolher sua porta (à qual continuaremos nos referindo como porta número 2), ele poderá escolher acidentalmente a que está com o carro, porque acha que ela tem uma cabra. Seja C a porta que Monty acha que tem o carro e p(C|C) seja a probabilidade de ele achar que o carro está em um determinado local, dependendo da sua localização real. Vamos supor que isso seja descrito por um único parâmetro q que determine sua precisão, de modo que: p(C=x|C=x)=q=1p(Cx|C=x) . Seq forigual a 1, Monty está sempre certo. Seq é 0, Monty está sempre errado (o que ainda é informativo). Seq é1/3 , a informação de Monty não melhor do que adivinhação aleatória é.

Isto significa que temos agora:

p(M|C=3)=xp(M|C=x)p(C=x|C=3)
=p(M|C=1)p(C=1|C=3)+p(M|C=2)p(C=2|C=3)+p(M|C=3)p(C=3|C=3)
=12×12(1q)+0×12(1q)+1×q
=14q4+q=34q+14

q(1q)

p(M|C=1)=xp(M|C=x)p(C=x|C=1)
=12×q+1×12(1q)
=q2+12q2=12

p(M|C=2)=xp(M|C=x)p(C=x|C=2)
=12×12(1q)+1×12(1q)
=3434q

p(C=3|M)=34q+1412+3434q+34q+14
=0.75q+0.251.5
q=111.5=23

p(C=3|M)>0.5p(C=3|M)>p(C=1|M)p(C=1|M)=0.51.5=13qp(C=3|M)>13

0.75q+0.251.5>13
0.75q+0.25>0.5
0.75q>0.25
q>13
p(C=3|M)p(C=1|M)
=0.75q+0.251.513=1.5q+0.5
q=1

q<13q=0

p(C=2|M)p(C=1|M)=0.750.75q1.513=1.51.5q
1.5q<0.5q<13q=0q=1

q>13

Ruben van Bergen
fonte
O valor esperado não voltaria a subir quando q < 1/3, porque não está modelando a probabilidade de que ele seja preciso, está modelando a probabilidade de estar errado? Quando se aproximava de 0, significa que ele está sempre mentindo, se puder, e seus ganhos esperados retornariam para 2/3
Cireo
2
@Cireo Ele não estaria mentindo, ele simplesmente estaria errado. Mentir implicaria que ele sabia que sua resposta estava errada. Eu suspeito que o motivo pelo qual o valor esperado não volte a aumentar é porque a chance de ele apontar acidentalmente para a porta com o carro atrás dela (ou seja, p (M | C = 2) está subindo) e você não pode escolher essa porta, não importa o que). q = 0 significa que ele sempre se lembra mal de onde está o carro, ou seja, agora há uma chance relativamente alta dele de apontar para a porta com o carro atrás dela.
Buurman 24/07
3
Uma solução mais geral (da qual isso obviamente precisa) inclui um Monty "hostil"; alguém que muda o que ele aponta (ou mesmo se ele aponta para alguma coisa), dependendo se você escolheu uma cabra ou um carro.
Yakk 24/07
3
@Yakk: Existem infinitamente mais cenários que você pode imaginar que mudam as probabilidades de infinitas maneiras. Também tudo depende se você sabe como Monty opera. Se você sabe que ele é hostil, na verdade ele não pode diminuir suas chances abaixo de 1/3, porque você simplesmente decide ignorar o que ele faz. Se você não conhece o processo de decisão dele, isso depende totalmente do que você assume e do que ele faz exatamente, e há muitos graus de liberdade por lá.
Ruben van Bergen
1
q=0
7

Essa deve ser uma variação bastante simples do problema (embora eu observe seu histórico limitado de matemática, acho que é relativo). Eu sugeriria que você primeiro tentasse determinar a solução condicional sobre se o Monte é infalível ou totalmente falível. O primeiro caso é apenas o problema comum de Monte Hall, portanto, não é necessário trabalho lá. No segundo caso, você trataria a porta que ele escolhe como aleatória em todas as portas, incluindo a porta com o prêmio (ou seja, ele ainda pode escolher uma porta sem prêmio, mas agora é aleatória). Se você puder calcular a probabilidade de vitória em cada um desses casos, use a lei da probabilidade total determinar as probabilidades de vitória relevantes no caso em que o Monte tenha algum nível especificado de falibilidade (especificado por uma probabilidade de que somos infalíveis versus totalmente falíveis).

Restabelecer Monica
fonte
2
Agradeço a resposta, mas estava procurando algo mais específico. Estou especificando que Monty escolheu uma porta. Estou especificando que a probabilidade de o prêmio estar por trás dessa porta pode variar de zero a 100%. Eu esperava uma fórmula que me permitisse simplesmente inserir a probabilidade de que Monty esteja certo / errado e, depois, elaborar o resto da fórmula forneceria uma estimativa numérica que indica a probabilidade de que a troca resultará em uma vitória. Esse grau de assistência é uma solicitação irrealista?
Pseudoego 24/07
4

Com base nos comentários da resposta de Ben, vou oferecer duas interpretações diferentes dessa variante de Monty Hall, diferentes das de Ruben van Bergen.

O primeiro, vou chamar de mentiroso Monty, e o segundo, não confiável Monty. Nas duas versões, o problema ocorre da seguinte maneira:

(0) Existem três portas, atrás de uma delas é um carro e atrás das outras duas são cabras, distribuídas aleatoriamente.

(1) O participante escolhe uma porta aleatoriamente.

(2) Monty pega uma porta diferente da porta do competidor e afirma que uma cabra está atrás dela.

(3) O participante é oferecido a mudar para a terceira porta não escolhida e o problema é "Quando o competidor deve mudar para maximizar a probabilidade de encontrar um carro atrás da porta?"

No Mentiroso Monty, na etapa (2), se o competidor escolhe uma porta contendo uma cabra, Monty escolhe uma porta que contém o carro com alguma probabilidade predefinida (ou seja, existe uma chance entre 0 e 100% de que ele a cabra está atrás de alguma porta). Observe que nesta variante, Monty nunca pega uma porta contendo o carro (isto é, não pode mentir) se o competidor escolheu o carro na etapa (1).

2313

Para responder ao problema, teremos que usar algumas equações. Vou tentar formular minha resposta para que ela seja acessível. As duas coisas que espero não sejam muito confusas são a manipulação algébrica de símbolos e a probabilidade condicional. Para o primeiro, usaremos símbolos para indicar o seguinte:

S=The car is behind the door the contestant can switch to.S¯=The car is not behind the door the contestant can switch to.M=The car is behind the door Monty chose.M¯=The car is not behind the door Monty chose.C=The car is behind the door the contestant chose in step (1).C¯=The car is not behind the door the contestant chose in step (1).

Pr()Pr(M¯)

Também exigiremos algum entendimento rudimentar da probabilidade condicional, que é aproximadamente a probabilidade de algo acontecer se você tiver conhecimento de outro evento relacionado. Essa probabilidade será representada aqui por expressões como . A barra verticalpode ser pensado como a expressão "se você souber", para que possa ser lido como "a probabilidade de que a porta para a qual o competidor possa mudar tenha o carro, se você souber que o o carro não está atrás da porta de Monty. No problema original de Monty Hall, , que é maior que , que corresponde ao caso em que Monty não forneceu nenhuma informação.Pr(S|M¯)|Pr(S|M¯)Pr(S|M¯)=23Pr(S)=13

Agora vou demonstrar que Monty não confiável é equivalente a Mentiroso Monty. No mentiroso Monty, recebemos a quantidade , a probabilidade de Monty mentir sobre sua porta, sabendo que o competidor não escolheu o carro. Em Monty não confiável, recebemos a quantidade , a probabilidade de Monty estar na porta dele. Usando a definição de probabilidade condicional e reorganizando, obtemos:Pr(M|C¯)Pr(M) Pr(M and C¯)=Pr(C¯|M)Pr(M)=Pr(M|C¯)Pr(C¯)

Pr(M)=Pr(M|C¯)Pr(C¯)Pr(C¯|M)32Pr(M)=Pr(M|C¯),
desde , a probabilidade de o carro estar não atrás da porta escolhida pelo competidor é e , a probabilidade de o carro não estar atrás da porta escolhida pelo competidor, se soubermos que está atrás da porta de Monty , é um.Pr(C¯)23Pr(C¯|M)

Assim, mostramos a conexão entre Monty não confiável (representado pelo LHS da equação acima) e Liar Monty (representado pelo RHS). No caso extremo de Monty não confiável, onde Monty escolhe uma porta que esconde o carro do tempo, isso é equivalente a Monty deitado o tempo todo em Mentiroso, se o competidor escolheu uma cabra originalmente .23

Tendo demonstrado isso, fornecerei informações suficientes para responder à versão do mentiroso do problema de Monty Hall. Queremos calcular . Usando a lei da probabilidade total :Pr(S)

Pr(S)=Pr(S|C)Pr(C)+Pr(S|C¯ and M)Pr(C¯ and M)+Pr(S|C¯ and M¯)Pr(C¯ and M¯)=Pr(C¯ and M¯)
desde que e (convença-se disso!).Pr(S|C)=Pr(S|C¯ and M)=0Pr(S|C¯ and M¯)=1

Continuando:

Pr(S)=Pr(C¯ and M¯)=Pr(M¯|C¯)Pr(C¯)=2323Pr(M|C¯))

Veja bem, quando Monty sempre mente (também conhecido como ), então você tem uma chance zero de ganhar se você alternar sempre, e se ele nunca mente, a probabilidade de o carro estar atrás a porta para a qual você pode alternar, , é .Pr(M|C¯))=1Pr(S)23

Com isso, você pode elaborar as estratégias ideais para Mentiroso e Monty não confiável.

Adenda 1

Em resposta ao comentário (ênfase minha):

"Adicionei mais detalhes no meu comentário ao @alex - Monty nunca é hostil nem desonesto, apenas FALÁVEL, pois às vezes ele pode estar errado por qualquer motivo e nunca abre a porta. Pesquisas mostram que Monty está errado aproximadamente 33,3% da hora, e o carro realmente está lá. Essa é uma probabilidade posterior de estar correto 66,6% das vezes, correto? Monty nunca escolhe SUA porta e você nunca escolhe a dele . Essas suposições mudam alguma coisa? "

É assim que entendo que o problema não confiável de Monty Hall foi introduzido no início da minha resposta.

Portanto, se a porta de Monty contiver o carro do tempo, temos a probabilidade de ganhar quando você alternar para a última porta não escolhida como:13

Pr(S)=2323Pr(M|C¯)=2323×32Pr(M)=2313=13

Portanto, não há diferença entre trocar, permanecer com a porta original ou, se permitido, trocar para a porta escolhida por Monty (de acordo com sua intuição).

Alex
fonte
Alex e @Ruben van Bergen et al. Obrigado pelos detalhes úteis. Suponha que Monty nunca seja hostil, apenas falível e diga: "Tenho certeza de que o carro NÃO está atrás desta porta". mas não abre a porta. Vamos supor que a pesquisa mostre que ele está errado apenas em 33,3% das vezes, corrigindo 66,6% (uma probabilidade posterior?). Ainda há algum benefício em alternar, mas uma vez que sua precisão atinge apenas 33,3%, não faria sentido mudar para a porta HIS ou a outra. Literalmente, um caso de "seu palpite é tão bom quanto o meu". Isso muda suas análises ou fórmulas?
Pseudoego 24/07
Não, isso não muda minha análise. Eu adicionei algo que espero esclarecer a questão no seu comentário. Aliás, eu não leria muito nas palavras "hostil", "falível", "mentiras monty". Isso realmente não significa nada, a menos que definido com precisão como a probabilidade (condicional) de que Monty esteja errado sobre uma porta contendo uma cabra.
Alex
Muito irritado que minha própria resposta à minha pergunta seja excluída com a única explicação dada, é que este site não é para "discussão" - quando estou principalmente explicando por que acho que as respostas dadas até agora estão corretas e explicando como elas serão seja útil. Houve muito mais discussão na maioria das outras respostas dadas. Isso me parece míope - na melhor das hipóteses - e idiota - na pior das hipóteses - para excluir a resposta de alguém à sua própria pergunta: como você pode explicar por que está classificando uma resposta como a melhor sem discuti-la? Obrigado a todos que responderam independentemente.
Pseudoego 25/07
@Pseudoego, seu último comentário é melhor postar como um comentário em sua pergunta original. Não vi sua resposta, mas parece que você deseja discutir as respostas existentes. Nesse caso, você pode modificar sua pergunta original.
Alex
0

Por alguma razão, um moderador decidiu excluir minha própria resposta à minha própria pergunta, alegando que continha "discussão". Realmente não vejo COMO posso explicar qual é a melhor resposta sem discutir o que a faz funcionar para mim e como pode ser aplicada na prática.

Agradeço as idéias e fórmulas fornecidas nas respostas anteriores. Parece que SE "Fallible Monty" tem apenas 66% de precisão na previsão da ausência de um Prêmio / Carro ENTÃO há ZERO benefício em mudar da sua escolha original de portas .... porque a taxa de erro de 33% é o padrão taxa básica para o Prêmio estar atrás de QUALQUER porta. Supõe-se, no entanto, que, se Monty fica melhor que 66% ao prever onde NÃO HÁ PRÊMIO, a comutação obtém maior utilidade.

Pseudoego
fonte