Pensei nesse problema no chuveiro, inspirado em estratégias de investimento.
Digamos que havia uma árvore mágica do dinheiro. Todos os dias, você pode oferecer uma quantia em dinheiro à árvore do dinheiro e ela triplicará ou a destruirá com probabilidade 50/50. Você percebe imediatamente que, em média, você ganhará dinheiro fazendo isso e está ansioso para tirar proveito da árvore do dinheiro. No entanto, se você oferecesse todo o seu dinheiro de uma só vez, teria 50% de perda de todo o seu dinheiro. Inaceitável! Você é uma pessoa bastante avessa a riscos e decide criar uma estratégia. Você quer minimizar as chances de perder tudo, mas também quer ganhar o máximo de dinheiro possível! Você cria o seguinte: todos os dias, você oferece 20% de seu capital atual à árvore do dinheiro. Supondo que o valor mais baixo que você pode oferecer seja de 1 centavo, seria necessário um período de 31 perdas para perder todo o seu dinheiro se você começasse com 10 dólares. O que mais, quanto mais dinheiro você ganhar, mais longa será a sequência de derrotas para você perder tudo, incrível! Você começa rapidamente a ganhar muito dinheiro. Mas então surge uma idéia: você pode oferecer 30% a cada dia e ganhar muito mais dinheiro! Mas espere, por que não oferecer 35%? 50%? Um dia, com grandes cifrões nos olhos, você corre para a árvore do dinheiro com todos os seus milhões e oferece 100% do seu dinheiro, que a árvore do dinheiro queima prontamente. No dia seguinte, você consegue um emprego no McDonalds. que a árvore do dinheiro queima imediatamente. No dia seguinte, você consegue um emprego no McDonalds. que a árvore do dinheiro queima imediatamente. No dia seguinte, você consegue um emprego no McDonalds.
Existe uma porcentagem ideal do seu dinheiro que você pode oferecer sem perder tudo?
(sub) perguntas:
Se houver uma porcentagem ideal que você deve oferecer, isso é estático (ou seja, 20% todos os dias) ou a porcentagem deve aumentar à medida que seu capital aumenta?
Ao oferecer 20% todos os dias, as chances de perder todo o seu dinheiro diminuem ou aumentam com o tempo? Existe uma porcentagem de dinheiro de onde as chances de perder todo o seu dinheiro aumentam com o tempo?
fonte
Respostas:
Este é um problema bem conhecido. Isso é chamado de aposta de Kelly. A resposta, a propósito, é 1/3. É equivalente a maximizar a utilidade logarítmica da riqueza.
Kelly começou levando tempo para o infinito e depois resolvendo para trás. Como você sempre pode expressar retornos em termos de composição contínua, também pode reverter o processo e expressá-lo em logs. Vou usar a explicação do utilitário de log, mas o utilitário de log é uma conveniência. Se você estiver maximizando a riqueza como , você terminará com uma função que funciona da mesma forma que o utilitário de log. Se for a probabilidade de pagamento for a probabilidade de ganhar e for a porcentagem da riqueza investida, a derivação a seguir funcionará.n→∞ b p X
Para uma aposta binária, , por um único período e riqueza unitária.E(log(X))=plog(1+bX)+(1−p)log(1−X)
Definir a derivada como zero para encontrar os extremos,
Multiplicação cruzada, você acaba compb(1−X)−(1−p)(1+bX)=0
pb−pbX−1−bX+p+pbX=0
bX=pb−1+p
X=bp−(1−p)b
No seu caso,X=3×12−(1−12)3=13.
Você pode facilmente expandir isso para resultados múltiplos ou contínuos, resolvendo a utilidade esperada da riqueza sobre uma distribuição de probabilidade conjunta, escolhendo as alocações e sujeita a quaisquer restrições. Curiosamente, se você executá-lo dessa maneira, incluindo restrições, como a capacidade de atender aos pagamentos de hipotecas e assim por diante, você contabilizou seu conjunto total de riscos e possui um ajuste de risco ou pelo menos um controle controlado solução.
Desiderata O objetivo real da pesquisa original tinha a ver com o quanto jogar com base em um sinal barulhento. No caso específico, quanto apostar em um sinal eletrônico barulhento, onde indica o lançamento de armas nucleares pela União Soviética. Houve vários lançamentos perto dos Estados Unidos e da Rússia, obviamente errados. Quanto você joga em um sinal?
fonte
Gostei da resposta dada por Dave Harris. embora eu achasse o problema de uma perspectiva de "baixo risco", em vez de maximizar o lucro
O passeio aleatório que você está fazendo, assumindo que sua fração aposta é e a probabilidade de ganhar foi dada como que . em média, você possui Você pode aplicar isso iterativamente para obter com valor esperado você também pode expressar a quantidade no tempo em função de uma única variável aleatória , mas observando que não é independente deq p = 0,5 Yt| Yt - 1= ( 1 - q+ 3 qXt) Yt - 1 X t ~ B e r n o u l l i ( p ) E ( Y t | Y t - 1 ) = ( 1 - q + 3 p q )Y t - 1 Y t | Y 0 = Y 0 t ∏ j = 1 i nXt~ B e r n o u l l i ( p ) E( Yt| Yt - 1) = ( 1 - q+ 3 p q) Yt - 1 Yt| Y0 0= Y0 0∏j = 1t( 1 - q+ 3 qXt) E( Yt| Y0 0) = ( 1 - q+ 3 p q)tY0 0 t Zt= ∑tj = 1Xt~ B i n o m i a l ( t , p ) Zt Zt - 1
Yt| Y0 0= Y0 0( 1 + 2 q)Zt( 1 - q)t - Zt
estratégia possível
você pode usar esta fórmula para determinar um valor de "baixo risco" para . Digamos que você queira garantir que, após perdas consecutivas, você ainda tenha metade da sua riqueza original. Então você defineq k q= 1 - 2- k- 1
Tomando o exemplo significa que definimos , ou com , definimos .k = 5 q= 0,129 k = 15 q= 0,045
Além disso, devido à natureza recursiva da estratégia, esse risco é o que você está assumindo a cada aposta. Ou seja, no tempo , continuando a jogar, você garante que no momento sua riqueza será de pelo menoss k + s 0,5 Ys
discussão
a estratégia acima não depende do resultado da vitória, mas de estabelecer um limite para a perda. Podemos obter os ganhos esperados substituindo o valor calculado e no momento usado com o risco em mente.q k
no entanto, é interessante observar a recompensa média em vez do esperado no tempo , que pode ser encontrado assumindo a . quando , temos a razão igual a . Isso é maximizado quando e maior que quandot m e di a n ( Zt)≈tp Yk|Y0=Y0(1+2q)tp(1−q)t(1−p) p = 0,5 ( 1 + q- 2 q2)0,5 t q= 0,25 1 q< 0,5
também é interessante calcular a chance de você estar à frente no tempo . para fazer isso, precisamos determinar o valor tal que fazendo alguma reorganização, descobrimos que a proporção de vitórias deve satisfazer Isso pode ser conectado a uma aproximação normal (nota: média de e erro padrão de ) comot z ( 1 + 2 q)z( 1 - q)t - z> 1 zt> log( 1 - q)registro( 1 - q) - log( 1 + 2 q) 0,5 0,5t√ Pr(ahead at time t)≈Φ(t√log(1+2q)+log(1−q)[log(1+2q)−log(1−q)])
o que mostra claramente que o jogo tem chances muito boas. o fator que multiplica é minimizado quando (valor maximizado de ) e está diminuindo monotonicamente em função de . portanto, a estratégia de "baixo risco" é apostar uma fração muito pequena da sua riqueza e jogar várias vezes.t√ q=0 13 q
suponha que comparemos isso com e . o fator para cada caso é e . Isso significa que, após jogos, você teria cerca de 95% de chance de estar à frente com a aposta pequena, em comparação com 75% de chance com a aposta maior. Além disso, você também tem a chance de falir com a aposta maior, supondo que você precise arredondar sua aposta para os 5 centavos ou dólar mais próximos. Começando com isso poderia ir . Esta é uma sequência de derrotas em , e dado o jogo esperariaq=13 q=1100 0.11 0.32 38 20 13.35,8.90,5.95,3.95,2.65,1.75,1.15,0.75,0.50,0.35,0.25,0.15,0.1,0.05,0 14 38 19 perdas, se você tiver azar com as primeiras apostas, mesmo as vitórias podem não compensar uma sequência ruim (por exemplo, se a maioria de suas vitórias ocorrer depois que a maior parte da riqueza se for). quebrar com a menor participação de 1% não é possível em jogos. O outro lado é que a aposta menor resultará em um lucro muito menor, em média, algo como um aumento de vezes com a aposta grande em comparação com o aumento de com a aposta pequena (ou seja, você espera ter 24 dólares depois de 38 rodadas com a pequena aposta e 7000 dólares com a aposta grande).38 350 1.2
fonte
Não acho que isso seja muito diferente do Martingale. No seu caso, não há apostas dobradas, mas o pagamento vencedor é 3x.
Eu codifiquei uma "réplica viva" da sua árvore. Eu corro 10 simulações. Em cada simulação (rastreio), você começa com 200 moedas e tenta com a árvore, uma moeda por vez, 20.000 vezes.
As únicas condições que interrompem a simulação são a falência ou a "sobrevivência" de 20 mil tentativas
Penso que, sejam quais forem as probabilidades, mais cedo ou mais tarde a bancarrota espera por você.
O código é javascript improvisado, mas sem dependência: https://repl.it/@cilofrapez/MagicTree-Roulette
Ele mostra os resultados imediatamente. O código é simples de ajustar: executar quantas simulações, valor da aposta, quantas tentativas ... Sinta-se à vontade para jogar!
Na parte inferior do código, os resultados de cada simulação (por padrão 10) são salvos em um arquivo CSV com duas colunas: número da rotação e dinheiro. Fiz isso para que ele pudesse ser alimentado em uma plotadora on-line para os gráficos.
Seria fácil automatizar tudo localmente, por exemplo, usando a biblioteca do Google Charts. Se você quiser ver apenas os resultados na tela, pode comentar a última parte, como mencionei no arquivo.
EDITAR
Código fonte:
fonte
Declaração do problema
Seja o logaritmo da quantidade de dinheiro o jogador tem no tempo .Yt=log10(Mt) Mt t
Seja a fração do dinheiro que o jogador está apostando.q
Seja a quantia em dinheiro que o jogador começa (dez dólares). Seja a quantia em dinheiro em que o jogador vai à falência (abaixo de 1 centavo). Por uma questão de simplicidade, adicionamos uma regra de que o jogador para de jogar quando passa uma quantia de dinheiro (mais tarde, podemos elevar essa regra assumindo o limite ).Y0=1 YL=−2 YW YW→∞
Caminhada aleatória
Você pode ver o crescimento e o declínio do dinheiro como uma caminhada aleatória assimétrica. Ou seja, você pode descrever como:Yt
Onde
Probabilidade de falência
Martingale
A expressão
é um martingale quando escolhemos tal que.c
Probabilidade de falência
O tempo de parada (perda / falência ou vitória ) é quase certamente finito, pois exige, no pior caso, uma sequência de vitórias (ou sequência de derrotas) de um determinado comprimento finito, , o que quase certamente vai acontecer.Yt<YL Yt>YW YW−YLaw
Então, podemos usar o teorema da parada opcional para dizer no tempo de parada igual ao valor esperado no tempo zero.E[Zτ] τ E[Z0]
portanto
e
e o limiteYW→∞
Conclusões
Qualquer que seja a porcentagem ideal, dependerá de como você avalia lucros diferentes. No entanto, podemos dizer algo sobre a probabilidade de perder tudo.
Somente quando o jogador apostar zero fração do seu dinheiro, ele certamente não irá à falência.
Com o aumento de a probabilidade de falir aumentará até certo ponto em que o jogador quase certamente falirá dentro de um tempo finito (a ruína do jogador mencionada por Robert Long nos comentários). Este ponto, , está em Este é o ponto em que não há solução para abaixo de um. Este também é o ponto em que as etapas crescentes são menores que as etapas decrescentes .q qgambler's ruin qgambler's ruin=1−1/b c aw al
Assim, para , desde que o jogador aposte menos da metade do dinheiro, o jogador certamente não irá à falência.b=2
A probabilidade de falir depende da distância da quantidade de dinheiro em que o jogador vai à falência. Quando o dinheiro do jogador aumentará, em média, e a probabilidade de falir diminuirá, em média.q<qgambler's ruin
Probabilidade de falência ao usar o critério de Kelly.
Quando você usa o critério de Kelly mencionado na resposta de Dave Harris, , para ser a razão entre perda e lucro em uma única aposta, então independente de o valor de será igual a e a probabilidade de falir será de .q=0.5(1−1/b) b b c 0.1 0.1S−L
Ou seja, independente do parâmetro de assimetria da árvore mágica, a probabilidade de falência, ao usar o critério Kelly, é igual à razão entre a quantidade de dinheiro em que o jogador vai à falência e a quantidade de dinheiro que o jogador inicia com. Por dez dólares e 1 centavo, é uma probabilidade de 1: 1000 de falência ao usar o critério de Kelly.b
Simulações
As simulações abaixo mostram diferentes trajetórias simuladas para diferentes estratégias de jogo. As trajetórias vermelhas são aquelas que acabaram em falência (acerte a linha ).Yt=−2
Distribuição dos lucros após o tempot
Para ilustrar ainda mais os possíveis resultados do jogo com a árvore do dinheiro, você pode modelar a distribuição de como um processo de difusão unidimensional em um campo de força homogêneo e com um limite absorvente (onde o jogador fica à falência). A solução para esta situação foi dada por SmoluchowskiYt
Essa equação de difusão refere-se ao problema da árvore quando definimos a velocidade igual ao aumento esperado , definimos igual à variação da alteração em uma única etapa , é o quantidade inicial de dinheiro, e é o número de etapas.c E[Yt] D Var(Xt) x0 t
A imagem e o código abaixo demonstram a equação:
O histograma mostra o resultado de uma simulação.
A linha pontilhada mostra um modelo quando usamos uma distribuição normal ingênua para aproximar a distribuição (isso corresponde à ausência da barreira absorvente da "falência"). Isso está errado porque alguns dos resultados acima do nível de falência envolvem trajetórias que passaram no nível de falência mais cedo.
A linha contínua é a aproximação usando a fórmula de Smoluchowski.
Códigos
fonte