Osborne, equilíbrios de Nash e a correção das crenças

12

Em Uma Introdução à Teoria dos Jogos, de Osborne, o equilíbrio de Nash é descrito a seguir (p. 21–22):

Primeiro, cada jogador escolhe sua ação de acordo com o modelo de escolha racional, considerando suas crenças sobre as ações dos outros jogadores. Segundo, a crença de cada jogador sobre as ações dos outros jogadores está correta.

Parece-me que essa definição não é completamente equivalente à definição usual do equilíbrio de Nash como perfil de estratégia, em que a estratégia de cada jogador é a melhor resposta às estratégias dos outros.

A definição usual não diz nada sobre crenças e, portanto, permite a possibilidade de que as crenças possam estar incorretas.

Para assumir uma possibilidade trivial, considere o dilema do prisioneiro. Suponha que cada jogador acredite que o outro jogador não confessará. Como confessar é uma estratégia dominante, cada jogador ainda confessaria. Portanto, as ações constituem um equilíbrio de Nash, embora as crenças dos jogadores sejam completamente o oposto das ações de equilíbrio reais.

Estou certo neste entendimento de que a definição de Osborne caracteriza algo diferente do equilíbrio de Nash?

Jyotirmoy Bhattacharya
fonte
Não "A definição usual não diz nada sobre crenças e, portanto, permite a possibilidade de que as crenças possam estar incorretas". Simplesmente depende do fato de você sempre ter uma suposição de racionalidade subjacente nessas definições?
Thorst

Respostas:

9

A introdução da linguagem das crenças aqui é um pouco estranha, dado que as crenças têm um significado muito específico em outras partes da teoria dos jogos.

De fato, a descrição de Osborne lembra o Equilíbrio de Bayes Nash. Poderíamos introduzir a noção de crenças na forma normal de um jogo completo de informações da seguinte maneira: suponha que, com probabilidade cada jogador, i , seja um tipo "estratégico" que jogará de acordo com o equilíbrio (Nash) e com probabilidade 1 - um i ele irá selecionar alguma estratégia uniformemente ao acaso (porque, por exemplo, ele é indiferente em todas as ações). Temos, portanto, um jogo bayesiano em que pensar em crenças é mais natural.aii1ai

O conceito da solução Bayes Nash diz então que a estratégia de deve ser ótima, dado o jogo esperado induzido pelas estratégias de outros jogadores e as crenças sobre seus tipos implícitas em { a j } j i . Se olharmos para o limite como um i1 para todo , então o equilíbrio Bayes Nash deste jogo irá coincidir com o conceito da solução descrita por Osborne.i{aj}jiai1i


Acho que a razão pela qual Osborne escreveu dessa maneira é pedagógica, dado que este é um texto introdutório. Quando introduzir os alunos para jogos estáticos, nós dizer-lhes que o jogador melhor responde às ações dos outros jogadores. Os alunos naturalmente querem saber "como eles podem responder a uma estratégia escolhida simultaneamente, sem saber qual será essa estratégia?" Esta é, em muitos sentidos, uma questão filosófica. Respostas comuns sãoEu

  • Se o jogo é jogado com frequência (deixando de lado questões de outros resultados que podem ser sustentados em jogos repetidos), podemos pensar em Nash como um equilíbrio no sentido de que, se convergirmos para lá, podemos desenvolver uma norma pela qual as pessoas continuem. jogar esse equilíbrio indefinidamente (e esperar que outros façam o mesmo).
  • Se o jogo é realmente único, geralmente invocamos a ideia de que os jogadores tentarão prever o que os outros farão - e nossa noção de equilíbrio incorpora a ideia de que essas previsões devem estar corretas.

Parece que as previsões no segundo ponto correspondem às "crenças" invocadas por Osborne. No entanto, é importante enfatizar que essas previsões / "crenças" são apenas uma ferramenta informal / intuitiva para nos ajudar a conceituar o que está acontecendo em equilíbrio e não fazem parte da definição desse equilíbrio. O próprio conceito de equilíbrio de Nash é completamente independente da noção de crenças (como você observa em um comentário, é definido apenas sobre ações), e é por isso que, quando Osborne define formalmente o equilíbrio de Nash, ele o faz sem invocar o idéia de crenças.

Onipresente
fonte
4

A introdução da crença torna o conceito de NE comparável a outros conceitos de refinamento, como PBE e equilíbrio seqüencial, mas o significado de NE não é alterado.

O micro livro didático de graduação de Mas-Colell, Whinston e Green (MWG) tem um resultado para este

σΓEμ

  1. σμ HPr(H|σ)>0 0
  2. O sistema de crenças deriva do perfil estratégico através da regra de Bayes sempre que possível.σμσ

Assim, o exemplo do dilema do prisioneiro é dado em que os jogadores têm crenças opostas ao que a estratégia real do oponente falha na segunda condição, o que exige que as crenças sejam derivadas da regra de Bayes sempre que possível. De fato, esse é o equivalente matemático do segundo requisito da definição de Osborne: que a crença de um jogador sobre as ações dos outros jogadores está correta.

Herr K.
fonte
Eu acho que há uma diferença entre MWG e Osborne. A MWG está dizendo que para um equilíbrio de Nash "existe" um sistema de crenças que o torna sensível. Ficamos em silêncio sobre quais crenças, se houver, os jogadores realmente têm. Osborne está dizendo que os jogadores realmente têm crenças e são os corretos. Eu pensei que o último muda o significado conceitual de NE, já que a definição usual não menciona crenças e o exemplo do dilema do prisioneiro mostra que as estratégias não determinam exclusivamente as crenças.
Jyotirmoy Bhattacharya 28/11
@JyotirmoyBhattacharya: Eu não acho que o MWG esteja "calado sobre quais crenças, se houver, os jogadores realmente têm". A condição 2 da proposição realmente exige que essa crença seja derivada do perfil da estratégia de equilíbrio usando a regra de Bayes sempre que possível. Assim, no exemplo da DP, quando um jogador escolhe o defeito com probabilidade 1, a crença do outro jogador também deve colocar a probabilidade 1 no defeito da ação e responder melhor dada essa crença (o que o leva também a escolher o defeito).
Herr K.
@JyotirmoyBhattacharya: A crença no NE não precisa ser única, no entanto. Isso ocorre porque, para um determinado equilíbrio, um caminho em uma árvore de jogo é tomado com probabilidade zero, a regra de Bayes não se aplica e, portanto, qualquer crença nesse caminho seria considerada "correta" em um NE. É também por isso que refinamentos como o equilíbrio seqüencial são introduzidos, de modo a excluir crenças irracionais dos caminhos de equilíbrio.
Herr K.
@JyotirmoyBhattacharya: Além disso, por ser um livro de graduação, Osborne pode ter escolhido uma linguagem que é mais intuitiva do que matematicamente rigorosa por razões pedagógicas. Para mim, as duas condições na definição de Osborne são contrapartes exatas na proposição da MWG.
Herr K.
3

O exemplo do dilema do seu prisioneiro só funciona porque é um jogo com estratégias dominantes. Osborne está correto.

Para responder melhor à estratégia de outro jogador, como na definição que você dá, devo conhecer a estratégia deles. Em outras palavras, eu devo ter crenças sobre o que eles estão fazendo, e essas crenças devem estar corretas. Este é um fortalecimento do conceito de racionalização.

(σ,μ1)(σ,μ2)μ2σΣσEuBEu(σ-Eu)... "Eu acredito que isso significa que a definição das crenças é desnecessária, porque as crenças são exatamente uma avaliação correta do perfil da estratégia. Referenciar, um dos meus livros, fornece a definição usual com uma citação de Nash (1950) e depois, discute duas suposições subjacentes: uma é crença correta e a outra é jogo racional, dadas essas crenças corretas.

Pburg
fonte
Mas refutar algo que um exemplo de país é suficiente. Se você considera Osborne como afirmando que sua definição é equivalente à de Nash, como lidar com o contra-exemplo do dilema do prisioneiro. Entendo que a definição de Osborne é um fortalecimento da racionalizabilidade, afirmo que não é o equilíbrio de Nash pela simples razão de que aqui o equilíbrio é definido sobre ações e crenças, enquanto o equilíbrio de Nash é completamente silencioso sobre crenças.
Jyotirmoy Bhattacharya
1
É uma definição, não uma prova.
Pburg
Justo. Mas é uma definição de um conceito que já tem outra definição bem aceita. Portanto, espero que, se o autor não mencionar o contrário, ele está reivindicando que as duas definições são equivalentes.
Jyotirmoy Bhattacharya
para ser claro, ele inclui esses comentários na definição ou na discussão? ps Eu editei minha resposta
Pburg
A parte que citei é discussão. Imediatamente depois disso, ele diz (p.22) "Esses dois componentes estão incorporados na seguinte definição" e, em seguida, fornece a definição padrão em termos de melhor resposta a estratégias que não mencionam crenças. Então, onde estão as crenças incorporadas na definição? E o problema não está apenas em jogos com estratégias dominantes. É bem possível construir exemplos onde não há estratégias dominantes, mas as estratégias de equilíbrio de Nash são as melhores respostas a crenças diferentes do jogo de equilíbrio.
Jyotirmoy Bhattacharya
2

Eu posso estar repetindo coisas que já foram ditas antes, mas aqui está minha opinião sobre isso.

Acho que enfrentamos um problema usual ao comparar dois modelos diferentes. O que significa uma "equivalência" não é completamente óbvio, porque as duas definições estão em mundos diferentes ou modelos diferentes. No entanto, se "equivalência" é definida adequadamente, acho que podemos entender a definição de Osborne e mostrar que ela é realmente "equivalente" a um NE.

O conceito de solução subjacente à seção citada seria algo como o seguinte:

sbEu

vocêEu(sEu | s-Eu=bEu)vocêEu(s | s-Eu=bEu) para todos sSEu
bEu=s-Eu

p

Esta é a parte complicada. O que significa que "Todo NE é um BE"? Certamente não que "um NE mais qualquer perfil de crença seja um BE", como o OP mostrou com seu contra-exemplo. No entanto, é o caso de que "qualquer NE pode ser transformado em BE para algum perfil de crença ". Eu acho que é nesse sentido que se deve entender a alegação de "equivalência" de Osborne

Observe que também temos a seguinte declaração "semelhante a equivalência": "Um resultado do jogo é um resultado NE, se e somente se for um resultado BE".

Martin Van der Linden
fonte
Mas todo BE não é um NE, uma vez que o conceito de BE é um enfraquecimento da racionalização que nós estritamente mais fracos que o NE.
Jyotirmoy Bhattacharya
Como escrevi, tenho dificuldade em entender o que significa para um BE "não ser" um NE, porque eles parecem viver em modelos diferentes. Você quer dizer que algumas estratégias adotadas em um BE não são NE? Eu pensei que estava incorreto, mas eu poderia ter perdido alguma coisa. Se é isso que você quer dizer, você poderia me indicar um contra-exemplo? Isso seria muito útil.
Martin Van der Linden
Não tenho certeza de que BE seja um enfraquecimento da racionalização. No meu entendimento, BE é racionalizável junto com a condição de que as conjecturas estão corretas, certo? Se isso estiver correto, não seríamos mais fortes que a racionalização? (pode, naturalmente, depender do que é chamado de "mais fraco mais forte /" conceito de solução)
Martin Van der Linden