O que há de errado com esta proposta de resolução do Paradoxo de São Petersburgo?

8

Temos um jogo em que o seu pagamento é que é o número de vezes que você jogou uma moeda para cair na cara (se o seu primeiro lançamento for uma cabeça, então ). Então o pagamento esperado é: E = 1 + 1 + 1 + ... E = \ infty k k = 1 E = 12kkk=1E=1+1+1+. . . E=

E=12(2)+14(4)+18(8)+...
E=1+1+1+...
E=

Quanto devo pagar para jogar este jogo?

Bem, sabemos pela distribuição geométrica o número esperado de moedas que jogarei até obter uma cabeça:

1P(HEAD)=1.5=2

Portanto, pagarei algo menor que 2k com k=2 :

ou seja, <4 dólares

https://en.wikipedia.org/wiki/St._Petersburg_paradox para referência

colorlace
fonte
"well" precisa de referências. De onde vem o "esperado" - dê um único exemplo antes de descrever uma soma. Negrito a pergunta real. Encontre uma maneira de aumentar os "tempos esperados para se entender" ... eu recomendo a simulação. O giro que fez a cabeça contar? Se você girar uma vez e pegar a cabeça, será zero antes ou antes? Você pode provar que foi responsável pelo "max" e não apenas pelo "mean" - onde está a cauda certa? Critério Kelly? ( en.wikipedia.org/wiki/Kelly_criterion )
EngrStudent 5/12
4
Se você avalia a aposta em US $ 4, que tal eu lhe pagar US $ 5 para jogar uma versão reduzida da aposta em São Petersburgo, onde eu posso ir no máximo 10 rodadas? Combinado?
Matthew Gunn
@EngrStudent O número "esperado" de inversões é igual à média de uma variável aleatória geométrica. Eu acho que você está certo, pois deveria ser mais explícito sobre qual intervalo estou usando {0,1,2, ...} ou {1,2,3 ...}.
colorlace
@MatthewGunn touché
colorlace

Respostas:

19
  • Seja uma variável aleatória.K

    • No seu problema, é o número de vezes que você vira antes de pegar a cabeça.K
  • Seja uma função de recompensa.f(k)

    • No seu problema .f(k)=2k
  • Seja a recompensaf(K)

Você está dizendo que uma avaliação razoável da aposta é dada por . Essa é uma heurística totalmente ad-hoc, sem princípios. Talvez seja bom em algumas situações (por exemplo, onde é pequeno próximo de linear), mas é fácil construir um exemplo em que sugere algo não sensorial.f(K)K ff(E[K])Kf

Exemplo em que seu sistema não faz absolutamente nenhum sentido

Seja um empate na distribuição normal e deixe a função de pagamento ser . Seu sistema diz que não devo pagar mais de por essa aposta porque . Mas você não deveria atribuir algum valor positivo a essa aposta ?! Há uma probabilidade de 100% de o pagamento ser maior que zero!N ( 0 , 10000000000000 ) f ( K ) = K 2 0 fKN(0,10000000000000)f(K)=K20f(E[K])=02=0

Uma resolução mais clássica do Paradoxo de São Petersburgo

Uma abordagem é adicionar aversão ao risco. Se você é suficientemente avesso ao risco, o que está disposto a pagar para jogar essa aposta infinita de expectativas será finito. Se você aceitar os axiomas de Von Neumann-Morgernstern , o equivalente de certeza de jogar o jogo é dado por que:z

u(w+z)=E[u(w+f(K))]

e onde é sua riqueza e é uma função côncava (no jargão, uma função de utilidade de Bernoulli) que captura seu nível de aversão ao risco. Se for suficientemente côncavo, a avaliação de será finita.u u 2 Kwuu2K

Uma função do utilitário Bernoulli com algumas boas propriedades acaba sendo . Maximizar a utilidade esperada onde a função de Bernoulli é o log de sua riqueza é equivalente a maximizar a taxa de crescimento esperada de sua riqueza. Para apostas binárias simples, isso oferece a você o Kelly Criterion .u(x)=log(x)

Outro ponto importante é que a abordagem de aversão ao risco leva a diferentes equivalentes de certeza, dependendo do lado da aposta em que você está.

Matthew Gunn
fonte
2
(+1) Além disso, a especificação da distribuição de uma recompensa não determina e forma exclusiva ; portanto, a heurística descrita no primeiro parágrafo precisaria de alguma maneira para deduzir a representação canônica de . f f ( K )Kff(K)
Juho Kokkala
2

Não há nada de errado com essa resolução proposta.

No paradoxo original, olhamos para o valor esperado (médio) do lucro que é infinito e, portanto, você deve apostar uma quantia infinita. No entanto, após o primeiro lançamento da moeda, há 50% de chance de você perder dinheiro e é por isso que as pessoas não gostam. Sua resolução apenas formaliza isso, em vez de olhar para o lucro médio que você está olhando para o lucro mediano. Diferentemente do lucro médio, o lucro mediano é finito e o paradoxo desaparece.

Hugh
fonte
2
Por que o lucro mediano seria relevante? Imagine seguir a aposta: 1% de ganhar nada, 1% de ganhar um milhão 1. Quanto você pagaria para jogar isso? and98
Daerdemandt
A dependência excessiva do @Daerdemandt na média é o que causa esse "paradoxo". Se você apostar uma quantia enorme em um jogo como esse, há 50% de chance de falir e ganhar milhões. Não é irracional tentar evitar a falência.
Hugh
Dinheiro ilimitado> muito dinheiro. Portanto, em termos de dinheiro, seria bastante racional jogar se você estiver bem com o jogo levando um tempo arbitrariamente longo. São essas suposições que fazemos para enquadrar o problema estatístico como mais real. Realisticamente, você teria problemas em esperar várias vidas para obter seu dinheiro ilimitado, sua utilidade marginal por dinheiro pode depender da quantidade de dinheiro que você tem (diabos, você pode até não ter a função de utilidade) - e seria muito cético com estranhos oferecendo-lhe para jogar para ganhar dinheiro ilimitado. Mas tudo isso está fora do escopo das estatísticas.
Daerdemandt 5/12
1
Em geral, não, não precisamos. Em problemas estatísticos de tipo semelhante, espera-se. (aqui está o jogo, quanto você pagaria para jogar?). O dinheiro é apenas um cotão para tornar o problema menos chato. Se você quiser desafiar o cotão, pode fazê-lo, mas isso está fora do escopo das estatísticas.
Daerdemandt
1
Não tenho certeza exatamente se as pessoas em geral atribuem significado suficientemente específico à palavra "paradoxo". Essa é uma situação hipotética que expande algumas das abstrações usadas. É útil demonstrar que essas abstrações não são perfeitas. Com essa leitura, eu pessoalmente agruparia essa situação com outros "paradoxos", seu uso pode ser diferente.
Daerdemandt
2

Se bem entendi, sua análise é:

  1. Calcule o número esperado de lançamentos de moedas necessários para obter uma cabeça.
  2. Calcule o pagamento do resultado em que você obtém exatamente o número esperado.
  3. Valorize o jogo igual a esse pagamento.

... OK, vamos modificar um pouco esse jogo. Assim como a versão original, vou jogar uma moeda e continuar lançando até jogar a cabeça. Somente os pagamentos foram alterados:

  • Se eu virar a cabeça no segundo arremesso, você ganha quatro dólares.
  • Em qualquer outro resultado, você perde tudo o que possui e precisa trabalhar para mim para sempre, de graça.

Quantas moedas esperamos jogar antes de conseguir uma cabeça? 2, exatamente o mesmo de antes.

Qual é o pagamento pelo resultado em que jogamos duas moedas para conseguir uma cabeça? US $ 4,00, exatamente o mesmo de antes.

Quanto você estaria disposto a pagar pelo 'privilégio' de pagar este jogo com 75% de chance de falir e 25% de retorno de $ 4,00?

Suspeito que a resposta não seja "até quatro dólares, exatamente a mesma de antes". O que significa que há um buraco na sua lógica.

Sob uma perspectiva mais ampla, os ganhos esperados não são necessariamente informações suficientes para responder a esse tipo de pergunta; geralmente depende de algum contexto adicional. Esta é uma oportunidade única ou você espera receber essa aposta muitas vezes? Quanto dinheiro você tem em mãos? E quanto dinheiro você precisa para ser feliz?

Por exemplo, se minha riqueza total for de US $ 100, mas eu precisar urgentemente de um milhão de dólares para uma operação que salva vidas, eu estaria disposto a pagar todo o meu dinheiro por uma única chance na aposta de São Petersburgo. Isso só me dá 1/2 ^ 19 de chance de ganhar o dinheiro que preciso, mas se eu não jogar, não tenho chance.

Por outro lado, se minha riqueza total é de US $ 1.000.000 e eu preciso exatamente de um milhão de dólares para essa operação, o máximo que eu estaria disposto a pagar por um único jogo é de dois dólares (que eu garantidamente recuperarei) . Mais alguma coisa, e eu tenho 1/2 chance de acabar com o milhão de dólares que preciso para salvar minha vida.

Se estou esperando ter muitas chances de jogar esses jogos, provavelmente quero escolher uma estratégia que me dê uma alta probabilidade de ter muito dinheiro no final de todos esses jogos. Por exemplo:

É garantido que o jogo A aumenta minha riqueza em 10% toda vez que o jogo. (Ganho esperado: + 10% da minha riqueza atual.) O jogo B tem 90% de chance de duplicar minha riqueza e 10% de chance de me levar à falência. (Ganho esperado: + 70% da minha riqueza atual.) [Editar: na verdade + 80% porque falhei na aritmética básica, mas o argumento ainda é válido.]

Se eu jogar 100 iterações do Jogo A, certamente multiplicarei minha riqueza por 13.780 vezes.

Se eu jogar 100 iterações do Jogo B, tenho 0,0027% de chance de me tornar inimaginavelmente rico (cerca de 10 ^ 30 vezes o que comecei) ... e 99,73% de chance de falir. Embora a média seja melhor do que no jogo A, não é uma boa opção.

Para esse tipo de jogo muito repetido, em vez de tentar maximizar meus ganhos esperados em cada jogo, é melhor tentar maximizar o valor esperado de ln (riqueza total após o jogo / riqueza total antes do jogo). Isso garante crescimento a longo prazo sem ser exterminado.

Se as apostas para cada jogo são pequenas em relação à minha riqueza total, isso é aproximadamente equivalente a maximizar os ganhos esperados em cada jogo.

Portanto, se você estiver jogando muitos jogos e nunca arriscando grande parte de sua riqueza atual, o valor esperado da aposta informa tudo o que você precisa saber. Em praticamente qualquer outra situação, você precisa pensar em outras coisas também.

Geoffrey Brent
fonte
1
+1 Obrigado por uma resposta cuidadosa que realmente aborda alguns dos problemas subjacentes fundamentais. Bem vindo ao nosso site!
whuber