Explicando estratégias mistas para jogos únicos

13

Na introdução clássica à teoria dos jogos não cooperativos, a estratégia mista para um jogador é ensinada como uma distribuição no espaço estratégico para o jogador. A distribuição nos dá essencialmente as probabilidades (digamos, conjunto de estratégias discretas) com as quais um jogador deve jogar as estratégias em um equilíbrio de Nash.

No entanto, as probabilidades carregam a noção de frequências e, essencialmente, significam a fração de jogos de longo prazo em que o jogador deve jogar a estratégia. No entanto, o cenário é um jogo de tiro único e isso é uma contradição.

Como resolvemos a contradição ao explicar o que é uma estratégia mista?

game-theory Bravo
fonte

2

Não é uma contradição para quem toma a interpretação de propensão da probabilidade, que vê o comportamento de longo prazo como a manifestação de probabilidades de caso único.

Pburg

11

Ariel Rubinstein tende a ser perspicaz em relação a esse tipo de perguntas.

Ele aborda a interpretação de estratégias mistas na seção 3 deste artigo.

Algumas interpretações possíveis, além da randomização deliberada:

Purificação: Uma estratégia mista é um plano de ação baseado em informações não especificadas no modelo.
Uma história fictícia de longo prazo.
Média da população, então imagine que o jogador está sendo retirado de alguma distribuição da população em que diferentes tipos jogam estratégias puras diferentes. A distribuição da população é a distribuição da estratégia mista.

Uma citação a respeito jogador interessante 's estratégia mista refletindo incerteza entre ' s sobre o que vou fazer: $i$ $-i$ $i$

A estratégia mista pode, alternativamente, ser vista como a crença de todos os outros jogadores em relação às ações de um jogador. Um equilíbrio de estratégia mista é então uma n-tupla de expectativas de conhecimento comum, que possui a propriedade de que todas as ações às quais uma probabilidade estritamente positiva é atribuída são ideais, dadas as crenças. O comportamento de um jogador pode ser percebido por todos os outros jogadores como o resultado de um dispositivo aleatório, mesmo que esse não seja o caso. A adoção dessa interpretação requer a reavaliação de grande parte da teoria dos jogos aplicada. Em particular, isso implica que um equilíbrio não leva a uma previsão (estatística ou não) do comportamento dos jogadores. A ação de qualquer jogador que seja a melhor resposta, dada sua expectativa em relação à o comportamento (as outras estratégias n - 1) é consistente como uma previsão da ação de i (isso pode incluir ações que estão fora do suporte da estratégia mista). Isso torna sem sentido qualquer estática comparativa ou análise de bem-estar do equilíbrio da estratégia mista e põe em questão a enorme literatura econômica que utiliza o equilíbrio da estratégia mista.

Pburg
fonte

6

Deixe denotar uma estratégia que atribui probabilidades para jogar , e deixá- ser o conjunto de tais estratégias, que resultam num equilíbrio num jogo simétrico para dois jogadores. $s_i = \{p_A^i, p_B^i\}$ $A,B$ $s = \{s_i, s_i\}_i$

Como você disse, nós pensamos sobre a ser probabilidades com que uma ação específica é jogado. Sempre que não é um singleton, temos múltiplos equilíbrios, algo que a maioria dos ramos da economia não gosta, porque dificulta a resolução de modelos e é difícil trabalhar com a não singularidade: como devemos simular o modelo? Qual dos equilíbrios realmente está sendo jogado? $s_i$ $s$

Pelo menos, com os equilíbrios de estratégia mista, sabemos a probabilidade de cada um dos equilíbrios acontecer. Você não gosta das probabilidades na medida em que elas carregam frequências, que você diz serem contrárias à noção de que o jogo é único.

Simultaneamente No entanto, o jogo sendo um tiro não significa que o jogo é jogado apenas uma vez. Em um mundo com muitos indivíduos, todos podem encontrar um parceiro e executar uma das estratégias em , na medida em que (ao mesmo tempo!) Encontramos deles no equilíbrio e a fração de indivíduos jogando o próximo equilíbrio, etc. $s$ $p_A$ $\{A, A\}$ $p_B$

Não simulatenamente Como alternativa, você poderia argumentar que, em um mundo com muito anonimato, as pessoas esquecem os parceiros com os quais brincaram antes. Temos muitas pessoas jogando estratégias no no tempo , então nós de-casal-los, dar todos os novos parceiros e deixá-los jogar novamente. Mesmo se houver a possibilidade de encontrar o mesmo cara novamente: como essa possibilidade é zero, você pode modelar isso como um jogo repetido com um fator de desconto . $s$ $t$ $\delta\rightarrow 0$

Falta de comprometimento Finalmente, pense em situações que na verdade são jogos repetidos, como interações entre o governo e os consumidores. Embora isso possa ser modelado como um jogo repetido, podemos pensar que o governo não é capaz de se comprometer com uma sequência de estratégia. Portanto, em vez de modelar isso como um jogo repetido, como repetições do equilíbrio de uma só vez: dado um horizonte temporal , veremos que das vezes, o governo e os consumidores jogam equilíbrio etc. $T$ $T\cdot p_A$ $\{A, A\}$

FooBar
fonte

2

Este é um complemento da citação de Pburg:

Uma visão de Aumann e Brandenburger (1995) é que a estratégia mista é apenas aos olhos dos oponentes. Em um jogo player, o conjunto de estados do mundo . Para um estado , ele atende à seguinte especificação: $N$ $\mathbf {S} : = \times_{i \in N} S_i$ $s \in \mathbf S$

$i$ $\pi_i : \mathbf {S} \to S_i$ $i$ $i$ $s_i$ $\pi_i^{-1}(s_i)$ $\pi_i^{-1}(s_i)$ $s_i$
$A_i$ $i$ $a_i : \mathbf{S} \to A_i$ $\left.a_i\right|_{\pi_i^{-1}(s_i)}$
$i$ $g_i$ $a_i$ $g(s) : \mathbf{A} \to \mathbb{R}$ $s \in \pi_i^{-1}(s_i)$ $s_i$

Metta Paz Mundial
fonte

1

Bem, aqui está minha chance de responder, seguindo este artigo em Física http://bayes.wustl.edu/etj/articles/prob.in.qm.pdf. Penso que a propensão é uma boa interpretação de estratégias mistas, mas mais formalmente deveríamos dizer que capta a ignorância do modelador. Dizemos que vale tudo, na verdade todas as estratégias poderiam ser adotadas (se o suporte for positivo em toda parte), mas o conceito da solução diz que certas são mais prováveis. As probabilidades aqui medem a ignorância do modelador e são o resultado da falta de informações do teórico do jogo sobre o jogo. Para esclarecer essa idéia de um conjunto de dados aprimorado, onde conhecemos informações adicionais sobre o jogo, digamos que falamos com um dos jogadores e ele nos assegura que ele adotará uma estratégia, não importa o quê, então podemos fazer uma previsão mais precisa. forma de uma estratégia pura. As frequências surgem quando pensamos no jogo como um jogo típico,

user157623
fonte

0

Isso não se aplica a todos os jogos, mas também há situações em que (pelo menos alguns) os jogadores realmente usam dispositivos de randomização em jogos que podem ser vistos de uma só vez. Aqui, distribuições de probabilidade não são frequências, são as distribuições que o dispositivo de randomização usa. Qualquer equilíbrio de estratégia mista é, então, um equilíbrio no sentido ex ante (embora os jogadores possam muito bem usar o dispositivo de randomização uma única vez, e talvez não haja nenhum sentido em que a situação ex post seja um equilíbrio).

Exemplos incluem:

Martin Van der Linden
fonte

Explicando estratégias mistas para jogos únicos

Respostas: