PBE de pegar ou largar

9

Eu encontrei uma pergunta interessante olhando para o perfeito equilíbrio bayesiano. Não vi uma pergunta em que as crenças não sejam discretas.

Existe um único comprador em potencial de um objeto que tem valor zero para o vendedor. A avaliação deste comprador v é distribuída uniformemente em [0, 1] e é uma informação privada. O vendedor nomeia um preço que o comprador aceita ou rejeita.p1

Se ele aceitar, o objeto é negociado pelo preço acordado e o pagamento do comprador é e o vendedor é .p 1vp1p1

Se ele rejeitar, o vendedor fará outra oferta de preço, p2. Se o comprador aceitar isso, seu pagamento será e o vendedor será , onde .δ p 2 δ = 0,5δ(vp2)δp2δ=0.5

Se ele rejeitar, os dois jogadores receberão zero (não há mais lances).

Encontre um Equilíbrio Bayesiano Perfeito.

Minha abordagem usual é fixar crenças, mas não sei como fazer isso com crenças contínuas. Algum conselho?

Brian
fonte
Desculpe, não consegui pensar em uma maneira fácil de dar conselhos parciais. Este é um bom exercício. Você (ou o criador) se importaria se eu o usasse na aula?
Giskard
Claro, fique à vontade!
Brian

Respostas:

6

Depois de postar uma solução ruim ontem, acredito que consegui uma melhor:

A estratégia do comprador consiste em duas funções que ambas as funções são mapeadas para { A , R } (onde A significa Accept, R para rejeitar). A estratégia do vendedor é ( p 1 , p 2 ( f 1 ( v , p 1 ) )(f1(v,p1),f2(v,p1,p2)){A,R}AR(p1,p2(f1(v,p1)))f2(v,p1,p2)Avp2Hp1p 1 v - p 1δ ( v - p 2 ) . v (

p2=argmaxp2p2Prob(f2(v,p1,p2)=A|f1(v,p1)=R).
p1
vp1δ(vp2).
v H H = [ 0 , ˉ v ) . p 2 ˉ v p 2 = arg max p 2 p 2P r o b ( v p 2 | v [ 0 , ˉ v ) ) = ˉ v
v(1δ)p1δp2.
O lado esquerdo desta equação está aumentando em ; portanto, os tipos com alta avaliação serão aceitos. Isso significa que no PBE o conjunto é tal que A partir disso, obtemos o ideal fornecido : No PBE é uma função de : então Determinamos todas as estratégias de PBE, masvH
H=[0,v¯).
p2v¯ˉ v p1 ˉ v(1-δ)=p1-δ ˉ v
p2=argmaxp2p2Prob(vp2|v[0,v¯))=v¯2.
v¯p1 ˉ v =p1
v¯(1δ)=p1δv¯2,
p1p1(1-P1-ôp2(ˉv(P1))
v¯=p11δ2.
p1 . A recompensa esperada do vendedor é onde Substituindo isso, obtemos
p1(1p1δp2(v¯(p1))1δ)+12p2(v¯(p1))(p1δp2(v¯(p1))1δp2(v¯(p1))),
p2(v¯(p1))=v¯(p1)2=p11δ22=p12δ.
p1(1p1δp12δ1δ)+12p12δ(p1δp12δ1δp12δ),

Você precisa maximizar esse erro . Com , obtive p1δ=0.5

p1=920,v¯=35,p2=310.
Giskard
fonte
Acho que essa pergunta também pode ser interpretada como uma empresa que tenta rastrear consumidores de diferentes avaliações representadas como o intervalo de unidades fechadas. O esquema de precificação ideal é estabelecer dois preços para que os clientes de altas avaliações paguem a um preço mais alto no primeiro estágio, e alguns daqueles de baixa avaliação paguem a um preço mais baixo no segundo estágio.
Metta World Peace
Você precisa explicar por que os utilitários são diferentes na segunda rodada. Para o vendedor, pode ser um desconto simples, mas para o comprador? Se o bem fosse durável, os tipos que compram o bem receberiam alguns benefícios nas duas rodadas.
Giskard
11
Eu não entendo direito. Por que os compradores não podem descontar o utilitário derivado no segundo turno? Isso pode ser interpretado como uma redução de preço de dois períodos, certo?
Metta World Peace
Embaraçoso, mas nunca ouvi falar desse modelo até agora. Você está correto, isso descreve bem o jogo acima.
Giskard
p1
vp1δ(vp2)
p1p2v