Em Uma Introdução à Teoria dos Jogos, de Osborne, o equilíbrio de Nash é descrito a seguir (p. 21–22):
Primeiro, cada jogador escolhe sua ação de acordo com o modelo de escolha racional, considerando suas crenças sobre as ações dos outros jogadores. Segundo, a crença de cada jogador sobre as ações dos outros jogadores está correta.
Parece-me que essa definição não é completamente equivalente à definição usual do equilíbrio de Nash como perfil de estratégia, em que a estratégia de cada jogador é a melhor resposta às estratégias dos outros.
A definição usual não diz nada sobre crenças e, portanto, permite a possibilidade de que as crenças possam estar incorretas.
Para assumir uma possibilidade trivial, considere o dilema do prisioneiro. Suponha que cada jogador acredite que o outro jogador não confessará. Como confessar é uma estratégia dominante, cada jogador ainda confessaria. Portanto, as ações constituem um equilíbrio de Nash, embora as crenças dos jogadores sejam completamente o oposto das ações de equilíbrio reais.
Estou certo neste entendimento de que a definição de Osborne caracteriza algo diferente do equilíbrio de Nash?
fonte
Respostas:
A introdução da linguagem das crenças aqui é um pouco estranha, dado que as crenças têm um significado muito específico em outras partes da teoria dos jogos.
De fato, a descrição de Osborne lembra o Equilíbrio de Bayes Nash. Poderíamos introduzir a noção de crenças na forma normal de um jogo completo de informações da seguinte maneira: suponha que, com probabilidade cada jogador, i , seja um tipo "estratégico" que jogará de acordo com o equilíbrio (Nash) e com probabilidade 1 - um i ele irá selecionar alguma estratégia uniformemente ao acaso (porque, por exemplo, ele é indiferente em todas as ações). Temos, portanto, um jogo bayesiano em que pensar em crenças é mais natural.ai i 1−ai
O conceito da solução Bayes Nash diz então que a estratégia de deve ser ótima, dado o jogo esperado induzido pelas estratégias de outros jogadores e as crenças sobre seus tipos implícitas em { a j } j ≠ i . Se olharmos para o limite como um i → 1 para todo , então o equilíbrio Bayes Nash deste jogo irá coincidir com o conceito da solução descrita por Osborne.i {aj}j≠i ai→1 i
Acho que a razão pela qual Osborne escreveu dessa maneira é pedagógica, dado que este é um texto introdutório. Quando introduzir os alunos para jogos estáticos, nós dizer-lhes que o jogador melhor responde às ações dos outros jogadores. Os alunos naturalmente querem saber "como eles podem responder a uma estratégia escolhida simultaneamente, sem saber qual será essa estratégia?" Esta é, em muitos sentidos, uma questão filosófica. Respostas comuns sãoi
Parece que as previsões no segundo ponto correspondem às "crenças" invocadas por Osborne. No entanto, é importante enfatizar que essas previsões / "crenças" são apenas uma ferramenta informal / intuitiva para nos ajudar a conceituar o que está acontecendo em equilíbrio e não fazem parte da definição desse equilíbrio. O próprio conceito de equilíbrio de Nash é completamente independente da noção de crenças (como você observa em um comentário, é definido apenas sobre ações), e é por isso que, quando Osborne define formalmente o equilíbrio de Nash, ele o faz sem invocar o idéia de crenças.
fonte
A introdução da crença torna o conceito de NE comparável a outros conceitos de refinamento, como PBE e equilíbrio seqüencial, mas o significado de NE não é alterado.
O micro livro didático de graduação de Mas-Colell, Whinston e Green (MWG) tem um resultado para este
Assim, o exemplo do dilema do prisioneiro é dado em que os jogadores têm crenças opostas ao que a estratégia real do oponente falha na segunda condição, o que exige que as crenças sejam derivadas da regra de Bayes sempre que possível. De fato, esse é o equivalente matemático do segundo requisito da definição de Osborne: que a crença de um jogador sobre as ações dos outros jogadores está correta.
fonte
O exemplo do dilema do seu prisioneiro só funciona porque é um jogo com estratégias dominantes. Osborne está correto.
Para responder melhor à estratégia de outro jogador, como na definição que você dá, devo conhecer a estratégia deles. Em outras palavras, eu devo ter crenças sobre o que eles estão fazendo, e essas crenças devem estar corretas. Este é um fortalecimento do conceito de racionalização.
fonte
Eu posso estar repetindo coisas que já foram ditas antes, mas aqui está minha opinião sobre isso.
Acho que enfrentamos um problema usual ao comparar dois modelos diferentes. O que significa uma "equivalência" não é completamente óbvio, porque as duas definições estão em mundos diferentes ou modelos diferentes. No entanto, se "equivalência" é definida adequadamente, acho que podemos entender a definição de Osborne e mostrar que ela é realmente "equivalente" a um NE.
O conceito de solução subjacente à seção citada seria algo como o seguinte:
Esta é a parte complicada. O que significa que "Todo NE é um BE"? Certamente não que "um NE mais qualquer perfil de crença seja um BE", como o OP mostrou com seu contra-exemplo. No entanto, é o caso de que "qualquer NE pode ser transformado em BE para algum perfil de crença ". Eu acho que é nesse sentido que se deve entender a alegação de "equivalência" de Osborne
Observe que também temos a seguinte declaração "semelhante a equivalência": "Um resultado do jogo é um resultado NE, se e somente se for um resultado BE".
fonte