Lances aleatórios ideais

7

Esta pergunta vem deste site que eu leio frequentemente.

Dois jogadores participam de um novo game show chamado "Maior número de vitórias". Os dois entram em cabines separadas, e cada um pressiona um botão, e um número aleatório entre zero e um aparece na tela. (Nesse ponto, nenhum dos dois conhece o número do outro, mas eles sabem que os números são escolhidos em uma distribuição uniforme padrão.) Eles podem optar por manter esse primeiro número ou pressionar o botão novamente para descartar o primeiro número e obter um segundo número aleatório, que eles devem manter. Então, eles saem de seus estandes e veem o número final de cada jogador na parede. O grande prêmio - um estojo cheio de barras de ouro - é concedido ao jogador que manteve o maior número. Qual número é o ponto de corte ideal para os jogadores descartarem o primeiro número e escolher outro? Dito de outra forma, dentro de qual intervalo eles devem escolher manter o primeiro número,

Este é um problema de leilão muito estranho com jogadores simétricos (também presumo que os jogadores são neutros ao risco) ou um jogo de loterias / teoria dos jogos muito estranho.

Como você abordaria esta questão matematicamente falando e que resposta você recebe? Não há nenhum prêmio para eu obter a resposta certa para o enigma do site, só estou curioso. Minha intuição me diz que o ponto de corte ideal é 0,5, pois você tem uma chance de 50 a 50 de ser maior ou menor que o número do seu oponente, independentemente de ele repetir o número aleatório ou não, mas não tenho certeza.

Cavalaria Kitsune
fonte
Eu não acho que a neutralidade do risco tenha algo a ver com isso, os jogadores simplesmente tentam maximizar sua probabilidade de ganhar. Os pagamentos são binários, não há resultados médios seguros.
Giskard
@denesp Você pode ser avesso ao risco, no sentido de que, se desenhar, digamos 0,46, talvez não queira redesenhar, mesmo tendo uma chance maior de obter um número melhor do que um número pior.
Kitsune Cavalry
11
@KitsuneCavalry Entendo o que você está dizendo, mas isso seria uma noção "comportamental" de aversão ao risco, pois é definida em uma etapa intermediária e não nos resultados finais.
Shane
@ Shane Claro, eu ouvi-lo. E eu não estou muito preocupado com isso de qualquer maneira.
Kitsune Cavalry

Respostas:

6

Primeiro vou mostrar que o 0.5 (ou 12 ) o ponto de corte não funciona como um equilíbrio simétrico, então você pode decidir por si mesmo se deseja pensar no problema ou ler a resposta completa.

Vamos denotar os pontos de corte por cx,cy . Suponha que ambos os jogadores usem a estratégia c=12 . Vamos denotar os números dos jogadoresxeyrespectivamente porx1ey1e seu segundo número potencial porx2ey2. Suponha quex1=23 . Mantendo isso, a probabilidade de o jogadorxvencer é

P(12y1<23)+P(y1<12)P(y2<23)=16+1223=12.
Isso também significa que23 éa mediana dessa distribuição.

Agora suponha que x1=12 . Mantendo isso, a probabilidade de o jogadorxvencer é

P(y1<12)P(y2<12)=1212=14
Mas se ele descartassex1=12 ele tem probabilidade
P(y1<12)P(x2>y2)+P(y112)P(x2>y1)=38
de ganhar. 38>14 mantendox1=12 (e seus arredores) não é o ideal, portanto, não pode ser um movimento de equilíbrio.


ALERTA DE SPOILER

Se o jogador y tem um cut-off cy e o jogador x desenha x1=cy e mantém a probabilidade de o jogador x vencer é

P(y1<cy)P(y2<cy)=cycy=cy2.
Se o jogador x onde descartar x1 a probabilidade de ele vencer é
P(y1cy)P(x2>y1)+P(y1<cy)P(x2>y2)=(1cy)(11+cy2)+cy12
Suponha que exista um equilíbrio simétrico, que écx=cy=c.
(Acho que não existem outros equilíbrios, mas não o provei.)
Como a probabilidade de ganhar é contínua no valor dex1, o valor de cortecé tal que, sex1=c, a probabilidade de ganhar é igual quandox1é mantido e quando é descartado. Isso significa que
P(y1<c)P(y2<c)=P(y1c)P(x2>y1)+P(y1<c)P(x2>y2)cc=(1c)(11+c2)+c12c2=12c+c22+c212c2+c212=0c=512.

Giskard
fonte
Alguém fez uma derivação semelhante à sua e fez o cálculo da Wolfram para checar: tinyurl.com/j9xey5t Então, eu vou adiante e digo que isso parece certo. Agora, se você resolver a forma geral deste jogo, eu darei a melhor resposta: P Brincadeira ~ (Embora seja interessante ver como o jogo muda com mais chances de rolar novamente.) Seu ponto de corte editado significa que os dois jogadores têm 50 % de vencedores, ou você ainda acha que há um erro na sua resposta?
Kitsune Cavalry
@KitsuneCavalry Acho que aceitá-lo foi um pouco prematuro, mas felizmente o cálculo está correto e meu raciocínio sobre os 50% estava errado. O ponto de corte é tão alto que o sorteio é um sorteio e, portanto, você tem mais de 50% de chance de ganhar se o desenhar. Antes do sorteio, você tem exatamente 50%.
Giskard
Se conta para alguma coisa, o site que deu a pergunta deu a resposta. Você conseguiu o dinheiro. Sinta-se como um vencedor hoje. Você ganhou B)
Kitsune Cavalry
2

c1c2c2c1p1(x)xp1(x)c1xx<c1c1x+xc1p2(x)p2(x)p1(x)0x1

  • (0,0)(c12,c1c2)0xc1
  • (c12,c1c2)(c1c2+c2c1,c22)c1xc2
  • (c1c2+c2c1,c22)(1,1)c2x1

12+12(c2c1)(c1c2+c21)

1c22c1c2+c22=01c1+2c2c12+2c1c2=0

(c2c1)(1+c1+c2)=0c1=c21c1c12=0c1=c2=512

f ''
fonte
Esta é uma ótima resposta, mas por que você chama o equilíbrio de estável?
Giskard
11
@denesp Eu acho que é redundante.
f ''