Eu li sobre o paradoxo da aposta de Blackwell no armário da Futility . Aqui está o resumo: você dois envelopes, e . Os envelopes contêm uma quantia aleatória de dinheiro, mas você não sabe nada sobre a distribuição do dinheiro. Você abre um, verifica quanto dinheiro há ( ) e precisa escolher: pegue o envelope ou ?E y x E x E y
O armário de futilidade refere-se a um matemático chamado Leonard Wapner: "Inesperadamente, há algo que você pode fazer, além de abrir o outro envelope, para ter uma chance melhor do que a correta de acertar".
A idéia, que me parece errada, é a seguinte: escolha um número aleatório . Se , pegue . Se , escolha .
Wapner: “Se d cai entre x e y, sua previsão (conforme indicada por d) é garantida como correta. Suponha que isso ocorra com probabilidade p. Se d cair menos que x e y, sua previsão estará correta apenas no caso de o número x escolhido ser o maior dos dois. Há 50% de chance disso. Da mesma forma, se d for maior que os dois números, sua previsão estará correta apenas se o número escolhido for o menor dos dois. Isso ocorre com uma probabilidade de 50% também. ”
Se a probabilidade de em [ x , y ] for maior que zero, o sucesso médio desse método é 1 . Isso significaria que a observação de uma variável aleatória não relacionada nos fornece informações adicionais.
Penso que tudo está errado e que o problema está na escolha de um número aleatório. O que isso significa? Tipo, qualquer número inteiro? Nesse caso, a probabilidade que d se situa entre x e y é zero, porque x e y são finitos.
Se dissermos que há um limite para a quantia máxima de dinheiro, digamos , ou pelo menos escolhermos d de 1 ... M , a receita se resume ao conselho trivial de escolher E y se x < M / 2 e escolhendo E x se x > M / 2 .
Perdi alguma coisa aqui?
EDITAR
OK, agora começo a ver de onde vem o aparente paradoxo. Pareceu-me impossível que uma variável aleatória não relacionada possa fornecer informações adicionais.
No entanto, observe que precisamos escolher conscientemente uma distribuição de d . Por exemplo, escolha os limites para uma distribuição uniforme, ou da distribuição Poissionian etc. Claramente, se estivermos jogando amendoins, e escolhemos a distribuição de d como uniforme em [ 10 9 , 2 ⋅ 10 9 ] dólares, P ( d ∈ ( x , y ) ) = 0 . Essa última probabilidade dependerá, em primeiro lugar, do nosso julgamento do que pode estar nos envelopes.
Em outras palavras, se a técnica funcionar, a suposição de que não sabemos qual é a distribuição do dinheiro nos envelopes (como a quantidade de dinheiro para os envelopes foi escolhida) será violada. No entanto, se realmente não sabemos o que há nos envelopes, no pior dos casos, não perdemos nada aplicando-o.
EDIT 2
Outro pensamento. Dado , vamos escolher, para desenhar d , uma distribuição contínua não-negativa tal que P ( d < x ) = P ( d > x ) . Estamos autorizados a fazer isso, estou correto? Prosseguimos conforme as instruções - se d < x , mantemos o envelope, se d > x , alteramos o envelope. O raciocínio não muda, dependendo de como escolhemos a distribuição, P ( d ∈ [ x , y ] ) > 0 (ou estou enganado?).
No entanto, dada a forma como escolhemos a distribuição, o que fazemos agora é equivalente a um sorteio. Atiramos uma moeda e, se são cabeças, trocamos envelopes, se são caudas, mantemos o envelope que seguramos. Onde eu estou errado?
EDIT 3 :
OK, entendi agora. Se basearmos a função de probabilidade de em x (por exemplo, amostrarmos d a partir de uma distribuição uniforme no intervalo ( 1 , 2 ⋅ x ) , a probabilidade P ( d ∈ ( x , y ) ) não será independente de P ( decisão correta | d ∉ ( x , y ) ) .
Portanto, se (com probabilidade p ), a suposição está sempre correta, como antes. Se x é o número mais baixo, e d ∉ ( x , y ) , que d tem uma chance maior de ser menor que x do que maior que x , então estamos inclinados para uma decisão incorreta. O mesmo raciocínio se aplica quando x é o maior dos dois números.
Isso significa que temos que escolher o processo de desenhar independentemente de x . Em outras palavras, precisamos adivinhar os parâmetros de distribuição dos quais x e y são extraídos; o pior que acontece é que ainda adivinhamos aleatoriamente, mas o melhor que acontece é que nosso palpite estava correto - e então temos uma vantagem. Como isso deve ser melhor do que adivinhar que "x e y serão, pelo menos, 1 dólar , mas no máximo 10 dólares , portanto, se x > 5 , nós o mantemos e, se não, o trocamos", ainda estou para Vejo.
Fui enganado pela formulação pop-sci do problema no livro de Wapner ( Expectativas Inesperadas: As Curiosidades de uma Bola de Cristal Matemática ), que afirma
"Por qualquer meio, selecione um número inteiro positivo aleatório" (Wapner sugere uma distribuição geométrica - jogando moedas até que as primeiras cabeças surjam, repetindo o processo se ) "Se d > x adivinhar mais e se d < x adivinhar (...) Você adivinhará corretamente mais de 50% das vezes, porque d aponta corretamente mais de 50% das vezes! "
fonte
Respostas:
Isso é mais conhecido como o problema dos dois envelopes . Geralmente, os valores são dados como e 2 A, mas não é necessário que seja esse o caso.A 2A
Alguns pontos:
Você não pode escolher um número inteiro aleatório uniformemente *, mas a parte entre aspas não parece exigir que seja uniforme. Escolha uma distribuição - não importa qual seja o argumento - desde que tenha alguma probabilidade de exceder qualquer valor finito.
Não faria sentido escolher inteiro com a regra de decisão citada, porque o dinheiro é discreto, o que significa que há uma chance diferente de zero d = xe não há nada listado para esse caso. (Ou, alternativamente, para modificar a regra e especificar o que fazer quando forem iguais)d d=x
Deixando isso de lado, você pode escolher partir de uma distribuição contínua não negativa - então não precisamos nos preocupar com igualdade.d
* (nem você pode escolher um número inteiro não negativo uniformemente aleatório nem um número positivo positivo uniformemente aleatório)
Se acontecer que a distribuição aleatória da qual é escolhido engloba M / 2, isso deve funcionar (fornecê-lo melhor que 50-50); se a distribuição estiver presa ao meio, isso não aconteceria.x M/2
No entanto, as versões deste jogo que me foram apresentadas pela primeira vez são que o envelope é apresentado por alguém que (possivelmente) procura minimizar sua receita com o jogo. A estratégia de usar uma distribuição para decidir se deseja alternar para o outro envelope ainda funcionará nessa instância.
fonte
O argumento de Wapner está correto!
Alguns comentários:
Um problema relacionado, mas diferente:
Como vários @Glen_b e @whuber mencionaram, há um quebra-cabeça relacionado, conhecido como o Problema dos Dois Envelopes, no qual é dado um argumento falacioso para sempre trocar envelopes e a falha no argumento pode ser vista adotando uma abordagem bayesiana e adicionando crenças anteriores sobre o problema. conteúdo dos dois envelopes.
Em certo sentido, porém, o quebra-cabeça descrito aqui é bastante diferente. O argumento de Wapner está correto!
fonte
I was intrigued by this and took the pragmatic approach of playing with it in Excel.
I generated three random numbers for x, y, and d in the range 1-100. I then did the comparison between d and x and between x and y and looked at the result, right or wrong.
I did this 500 times and repeated that several times and regularly got the right answer arounf 330 out of 500, as predicted.
I then increased the range of d to 1-10000 and the correct answer dropped to about 260 for 500 runs.
So yes, the selection of d is dependant on the expected values of x and y.
BoB
fonte
I think the apparent paradox with the Wapner expansion of the equation p + (1-p)/2 is that it assumes that (1-p)/2 >0. For many ranges of d this value is 0.
For example: any d selected from a symmetric distribution centered on the value in the open envelope, gives a probability of wrong 1/2 and correct 1/2.
Any asymmetrically chosen distribution appears to bias the choice the wrong way 1/2 the time.
So is there a way to choose a range and distribution for d such that this equation holds?
fonte