Suponha que há um jogo de sinalização com um espaço finito mensagem , finito espaço de ação , e tipo espaço finito . Ainda mais simples, todos os tipos de remetentes têm preferências idênticas (o receptor apenas prefere ações diferentes em resposta a tipos diferentes). O receptor pode se sair estritamente melhor ao aleatorizar as respostas? Quando existe um equilíbrio em que o receptor apenas realiza ações puras?
Ubiquitous resumiu bem minha pergunta: "É sempre o caso que o equilíbrio com os maiores retornos de recebedores necessariamente envolve estratégias mistas?"
Vamos com o equilíbrio seqüencial. Se você deseja alguma notação, para começar.
t ∈ T m ∈ M é a probabilidade de que envia .
m uma ∈ Uma . μ m ∈ ô T m é a probabilidade de o receptor responder a com fornece as crenças do receptor após observar .
Um equilíbrio seqüencial requer fornece respostas ótimas dadas , é ótimo dado e é bayesiano dado . Essa é realmente a definição de um seqüencial fraco, mas não há distinção em um jogo de sinalização.
Minha intuição diz não quando existe um equilíbrio em que o receptor apenas executa ações puras, mas eu sempre fui horrível com esse tipo de coisa. Talvez também tenhamos que estipular que não se trata de um jogo de soma zero, mas só estou dizendo isso porque lembro que os jogadores estão em melhor situação com a capacidade de aleatorizar nesses jogos. Talvez esta seja uma nota de rodapé em algum artigo?
Considere o jogo abaixo, onde as preferências do remetente não são idênticas. Peço desculpas pela baixa qualidade. Existem três tipos de remetentes, cada um igualmente provável. Podemos criar o que acredito ser o equilíbrio ótimo do receptor (jogador 2) somente se eles aleatorizarem ao receber a mensagem 1. Então os tipos 1 e 3 reproduzirão , criando um equilíbrio de separação. Se o receptor usar uma estratégia pura em resposta a , um tipo 1 ou 2 se desviaria e pioraria o receptor.m 1
fonte
Respostas:
Talvez eu tenha um contra-exemplo!
Haja três mensagens, e , e três tipos de remetentes onde , e . O envio de resulta em um pagamento para remetentes, podemos pensar nisso como sair do jogo.m1,m2, m3 t1,t2,t3 Pr(t=t3)=12−ϵ Pr(t=t2)=14 Pr(t=t1)=14+ϵ m3 0
O conjunto de respostas do receptor a uma mensagem ém=m1,m2 {a,r}
Então, em equilíbrio, todos os remetentes devem obter a mesma utilidade, correto? Caso contrário, um imitará a estratégia do outro.
Portanto, o único equilíbrio puro da estratégia é que todos os remetentes escolham . Em um equilíbrio de conjunto em ou , a melhor resposta é escolher . Não existe uma estratégia pura que separa o equilíbrio, exceto se e enviam , e o receptor responde com . Então é indiferente entre todas as mensagens, porque ele certamente será recebido com a recompensa . Tudo isso fornece retorno ao receptorm3 m1 m2 r t1 t2 m2 r t3 0 32−ϵ
Em seguida, considere o caso em que eAgora, os remetentes são indiferentes entre o envio dessas duas mensagens. Então, e para . Então a estratégia do receptor é racional.σm1R(a)=β σm2R(a)=1. σt3(m1)=ϵ+1/4−ϵ+1/2=1−σt3(m1) σti(mi)=1 i=1,2
O utilitário esperado do receptor de dado ou é 1,5. O utilitário esperado de está ligeiramente acima de 1,5, dado . Portanto, o retorno esperado ex ante está acima de , melhor do que o puro equilíbrio descrito acima. Além disso, essa separação é mantida apenas pela mistura. Qualquer outra estratégia pura adotada pelo receptor induzirá o agrupamento de remetentes, o que significa que o único equilíbrio puro da estratégia é quando o receptor escolhe .m1 a r m2 a 32−ϵ r
Eu deveria ter s na imagem abaixo para os pagamentos do remetente do lado esquerdo para . Eu acho que o é o ingrediente principal.β a β<1
fonte
Eu acho que isso não pode acontecer com remetentes avessos ao risco, receptor neutro ao risco e rico o suficiente.A
Por exemplo, e para manter o modelo de sinalização canônica, suponha que seja a linha real positiva e a utilidade do remetente esteja aumentando em tempo enquanto os receptores possuam uma utilidade linear decrescente em .A u a a
(É certo que essa é apenas uma resposta parcial, já que a estrutura é muito menos geral que a da sua pergunta, portanto pode não ser satisfatória para você. Eu ainda apresento um argumento caso você esteja de acordo com essas suposições)
Derivar uma contradição, suponha que em um equilíbrio e para alguns . DeixeiσmR(a′)>0 σmR(a′′)>0 a′≠a′′∈A
Por aversão ao risco
Sob alguma hipótese de continuidade, também deve existir
de tal modo que
Portanto, considere construído da seguinte maneiraσmR′
Os receptores preferem sobre se não alterar os sinais enviados pelos remetentes, porque envolve compensações esperadas mais baixas. Mas, por construção, os remetentes são indiferentes entre e , portanto, eles devem enviar os mesmos sinais que em . Assim, não pode ser um equilíbrio que mostra que não podemos ter duas ações diferentes executadas com probabilidade positiva em equilíbrio.σmR′ σmR σmR′ σmR σmR σmR
fonte