Envelope Paradox

8

Existem dois envelopes. Um contém x dinheiro e o outro contém 2x quantidade de dinheiro. A quantidade exata " x " é desconhecida para mim, mas eu sei o que foi dito acima. Pego um envelope e o abro. Eu vejo y dinheiro nele, obviamente onde y{x,2x} .

Agora me oferecem a manutenção ou troca de envelopes.

O valor esperado da troca é . O valor esperado de manter meu envelope éy.(122y+1212y)=54yy

Parece que eu sempre deveria trocar de envelopes. Minhas duas perguntas:

Esse raciocínio está correto?

É diferente se eu não estou autorizado a abrir o envelope e ver a quantidade de dinheiro, e então eu sou dado a opção de alternar indefinidamente?y

Cavalaria Kitsune
fonte
11
Você não pode apenas assumir a expectativa; deve começar com crenças sobre x e atualizá-las de acordo com a regra de Bayes. Depois de ver y, suas crenças sobre qual envelope você abriu terão mudado.
HRSE
Digamos que x seja distribuído uniformemente entre 0 e . Então o que?
Kitsune Cavalry
@KitsuneCavalry Não existe tal distribuição. (Por favor, envie-me um programa que gere essa distribuição.) De fato, não há resolução que gere as piores crenças dadas na sua pergunta para todos os valores de . No link de Herr K., isso é explicado em en.wikipedia.org/wiki/…y
Giskard 8/16
3
@Kitsune Cavalry A distribuição uniforme ao longo da meia linha (ou de toda a linha) é um antes impróprio bem conhecido nas estatísticas bayesianas, veja o exemplo stats.stackexchange.com/a/97790/28746 ou stats.stackexchange.com/a/ 35794/28746
Alecos Papadopoulos

Respostas:

5

Aqui está uma abordagem de "maximização da utilidade esperada / teoria dos jogos" (com uma pitada de probabilidade da teoria dos conjuntos). Nesse quadro, as respostas parecem claras.

PREMISAS

Dizem-nos com absoluta honestidade que, para um valor monetário estritamente positivo, os dois bilhetes a seguir foram colocados em uma caixa: { A = x , B = 2 x } com o número de identificação atribuído 1 e { A = 2 x , B = x } com o número de identificação atribuído 0 . Em seguida, foi realizado um sorteio de uma variável aleatória Bernoulli ( p = 0,5 ) e, com base no resultado e no evento que ocorreu, os valores x ex{A=x,B=2x}1{A=2x,B=x}0(p=0.5)x foram colocados em envelopes A e B . Não nos dizem qual é o valor de x ou qual foi o valor para qual envelope.2xABx

Primeiro CASO: Escolha um envelope com a opção de alternar sem abri-lo

A primeira questão é como escolhemos um envelope ? Isso tem a ver com preferências. Portanto, assuma que somos maximizadores de utilidade esperados, com a função de utilidade .u()

Podemos modelar a estrutura probabilística aqui considerando duas variáveis ​​aleatórias dicotômicas, e B representando os envelopes, e a quantidade neles. O suporte de cada um é { x , 2 x } . Mas eles não são independentes. Então, temos que começar com a distribuição conjunta. Em forma de tabela, a distribuição conjunta e as distribuições marginais correspondentes sãoAB{x,2x}

A/Bx2xMarg Ax00.50.52x0.500.5Marg B0.50.51.00

Isso nos diz que e B têm distribuições marginais idênticas.AB

Mas isso significa que não importa como escolhemos envelopes, porque sempre obteremos o mesmo utilitário esperado ,

0.5u(x)+0.5u(2x)

O que estamos enfrentando aqui é uma aposta composta (como escolher um envelope) sobre duas apostas idênticas (cada envelope). Podemos escolher com probabilidade 1 , 0 ou qualquer coisa intermediária (e complementarmente para B ). Não importa. Sempre teremos o mesmo utilitário esperado. Observe que nossa atitude em relação ao risco não desempenha um papel aqui.A10B

Então escolhemos um envelope, digamos , e estamos olhando para ele. Qual é agora a nossa utilidade esperada? Exatamente o mesmo que antes da escolha . Escolher um envelope de qualquer maneira não afeta as probabilidades do que está dentro.A

B

AB

Então, aqui, somos indiferentes à mudança. e, de fato, também poderíamos aleatoriamente.

2º CASO: ABRIR O ENVELOPE com a opção de alternar após

Ay{x,2x}

Vamos ver. Eu me pergunto o que é

P(A=xA{x,2x})=?

{x,2x}AA

Mas também me pergunto, o que é

P(B=xA{x,2x})=?

{A{x,2x}}(A,B)BB

u(y)

y=x,u(A)=u(x)u(B)=u(2x)
y=2x,u(A)=u(2x)u(B)=u(x)

p=0.5

p=0.5 y=xp=0.5y=2x

We/naturey=xy=2xSwitchu(2x)u(x)Don't Switchu(y)u(y)

u(x)u(2x)u(y)u(y)xy=xu(2x)=u(2y)y=2xu(x)=u(y/2)

We/naturey=xy=2xSwitchu(2y)u(y/2)Don't Switchu(y)u(y)

Agora todos os payoffs na matriz são conhecidos. Existe uma estratégia dominante pura?

O retorno esperado da estratégia "Switch" é

E(VS)=0.5u(2y)+0.5u(y/2)

O retorno esperado da estratégia "Não mude" é

E(VDS)=u(y)

Devemos mudar se

E(VS)>E(VDS)0.5u(2y)+0.5u(y/2)>u(y)

E agora , a atitude em relação ao risco se torna crítica. Não é difícil deduzir que, sob comportamentos de risco e neutro, devemos mudar.

No que diz respeito ao comportamento avesso ao risco , encontro um resultado elegante:

Para funções utilitárias "menos côncavas" (estritamente acima) do que logarítmicas (por exemplo, raiz quadrada), ainda devemos alternar.

u(y)=lny

Por "mais côncava" do que (estritamente abaixo) funções de utilidade logarítmica, devemos não interruptor.

Fecho com o diagrama do caso logarítmico

insira a descrição da imagem aqui

y=4y/2=2,2y=8ΓΔΕ5050ΔΓΔΕln(4)

Alecos Papadopoulos
fonte
u(2y)u(y/2xx>0xxyyé suficientemente grande. Veja jstor.org/stable/2685310 .
Jarle Tufto 15/01
p=0.5
X2XXπ(x)=1x>0P(X=y|Y=y)=P(X=y/2|Y=y)=1/2yπ(x)y
@JarleTufto Este impróprio antes de você mencionar, reflete probabilidades relacionadas a quê?
Alecos Papadopoulos
X2XX
0

Se você abrir o envelope E1 e verificar que seu valor é E1 = Y , é verdade que o valor do outro envelope E2 está em {E2 = Y / 2, E2 = 2Y} .

Também é verdade que o valor esperado desse envelope é (Y / 2) * Pr (E2 = Y / 2) + (2Y) * Pr (E2 = 2Y) .

O erro está assumindo que Pr (E2 = Y / 2) = Pr (E2 = 2Y) = 1/2, independentemente do que Y é. Uma maneira simplista de mostrar isso é assumir que cada envelope contém papel-moeda dos EUA de várias denominações. Se Y = $ 1 , é impossível para E2 ser Y / 2 .

Uma prova mais rigorosa é muito detalhada para fornecer aqui, mas um resumo disso é primeiro supor que, para qualquer valor Z , Pr (Z / 2 <= E2 <Z) = Pr (Z <= E2 <2Z) . Essa é essencialmente a mesma suposição que no último parágrafo, expandida para uma faixa de valores. Mas se isso é verdade para qualquer valor de Z , significa que Pr (Z * 2 ^ (N-1) <= E2 <Z * 2 ^ (N-1)) é constante para todo valor de N , de -inf a inf. Como isso é impossível, a suposição não pode estar correta.

+++++

Isso pode ter sido um pouco confuso, então deixe-me tentar um exemplo. Você recebe dois conjuntos de dois envelopes. Em um conjunto, eles contêm 10 e 20 dólares. No outro, eles contêm 20 e 40. Você escolhe um conjunto e, em seguida, abre um envelope nesse conjunto para encontrar 20. Você tem a chance de mudar para o outro envelope desse conjunto. Você deveria?

Sim, deve mudar. O ganho esperado ao mudar para o outro envelope é [(20-10) + (20-40)] / 2 = +5.

Observe que essa instância - ou seja, sabendo que você encontrou 20, e não 10 ou 40, se encaixa nas condições descritas em sua pergunta. Portanto, sua solução funciona. Mas o experimento em si não se encaixa nessa descrição. Se você encontrou 10 ou 40, a probabilidade de outro envelope ter 20 é 100%. Os ganhos esperados são +10 e -20, respectivamente. E se você calcular a média dos três ganhos possíveis em relação às probabilidades, obteria os três valores, obterá 10/4 + 5/2 - 20/4 = 0.

JeffJo
fonte
Por que eu assumiria que um envelope não poderia ter 50 centavos? Além disso, a pergunta é especificamente sobre horários em que você não sabe os possíveis valores que poderiam estar nele, apenas os possíveis valores relativos, por isso não estou realmente seguindo isso.
Kitsune Cavalry
2|E1=
0

Geralmente, o problema é insolúvel, porque você não especificou o procedimento de randomização de toda a experiência.

E[X|Y=y]RPr(Y=y)=0

John Rambo
fonte
@JeffJo, não pude comentar em sua postagem por não ter reputação suficiente. Adicionei esta resposta porque acredito que esteja relacionada à sua postagem.
John Rambo