Acabei de jogar um jogo com meus filhos que basicamente se resume a: quem joga todos os números pelo menos uma vez em um dado de 6 lados ganha.
Ganhei, eventualmente, e os outros terminaram 1-2 turnos depois. Agora estou me perguntando: qual é a expectativa da duração do jogo?
Eu sei que a expectativa do número de jogadas até você atingir um número específico é .
No entanto, tenho duas perguntas:
- Quantas vezes você precisa rolar um dado de seis lados até obter todos os números pelo menos uma vez?
- Entre quatro tentativas independentes (ou seja, com quatro jogadores), qual é a expectativa do número máximo de jogadas necessário? [nota: é o máximo, não o mínimo, porque na idade deles, trata-se mais de terminar do que de chegar primeiro para os meus filhos]
Posso simular o resultado, mas me pergunto como procederia para calculá-lo analiticamente.
Aqui está uma simulação de Monte Carlo no Matlab
mx=zeros(1000000,1);
for i=1:1000000,
%# assume it's never going to take us >100 rolls
r=randi(6,100,1);
%# since R2013a, unique returns the first occurrence
%# for earlier versions, take the minimum of x
%# and subtract it from the total array length
[~,x]=unique(r);
mx(i,1)=max(x);
end
%# make sure we haven't violated an assumption
assert(numel(x)==6)
%# find the expected value for the coupon collector problem
expectationForOneRun = mean(mx)
%# find the expected number of rolls as a maximum of four independent players
maxExpectationForFourRuns = mean( max( reshape( mx, 4, []), [], 1) )
expectationForOneRun =
14.7014 (SEM 0.006)
maxExpectationForFourRuns =
21.4815 (SEM 0.01)
Respostas:
Como uma "abordagem completamente analítica" foi solicitada, aqui está uma solução exata. Ele também fornece uma abordagem alternativa para resolver a questão no Probability de desenhar uma bola preta em um conjunto de bolas preto e branco com condições de substituição mistas .
O número de jogadas no jogo, , pode ser modelado como a soma de seis realizações independentes de variáveis geométricas com probabilidades , cada uma delas deslocada por (porque uma variável geométrica conta apenas as jogadas anteriores a um sucesso e também devemos contar as jogadas nas quais os sucessos foram observados). Ao computar com a distribuição geométrica, obteremos respostas inferiores às desejadas e, portanto, não se esqueça de adicionar no final.X (p) p=1,5/6,4/6,3/6,2/6,1/6 1 6 66 6
A função geradora de probabilidade (pgf) de uma variável geométrica com o parâmetro ép
Portanto, o pgf para a soma dessas seis variáveis é
(O produto pode ser calculado neste formulário fechado, separando-o em cinco termos por meio de frações parciais.)
A função de distribuição cumulativa (CDF) é obtida a partir das somas parciais de (como uma série de potências em ), que equivale à soma de séries geométricas, e é dada porg z
(Eu escrevi essa expressão de uma forma que sugere uma derivação alternativa por meio do Princípio da inclusão-exclusão.)
A partir disso, obtemos o número esperado de jogadas no jogo (respondendo à primeira pergunta) como
O CDF do máximo de versões independentes de é (e, a partir disso, podemos, em princípio, responder a quaisquer perguntas de probabilidade sobre o máximo que gostamos, como qual é sua variação, qual é o seu percentil 99 , e assim por diante). Com , obtemos uma expectativa dem X F(z)m m=4
(O valor é uma fração racional que, na forma reduzida, possui um denominador de 71 dígitos.) O desvio padrão é Aqui está um gráfico da função de massa probabilística do máximo para quatro jogadores (ela já foi alterada por ):6.77108…. 6
Como seria de esperar, é positivamente distorcido. O modo está em rolos. É raro que a última pessoa a terminar leve mais de rolos (é cerca de ).18 50 0.3%
fonte
O ThePawn tem a ideia certa de atacar o problema com um relacionamento de recorrência. Considere uma cadeia de Markov com os estados correspondentes à contagem do número de jogadas de dados distintas que ocorreram. O estado 0 é o estado inicial e o estado 6 é o estado final. Então, a probabilidade de transição do estado para si é . A probabilidade de transição do estado para o estado é . Portanto, o tempo de acerto do estado final é{0,…,6} i i6 i i+1 6−i6
Para o máximo de quatro tentativas, considere estados quádruplos. Você deseja encontrar o tempo de acerto esperado para o estado de destino . O tempo de acerto esperado de qualquer estado é a média ponderada de cada estado de origem do tempo de acerto esperado mais o tempo de ir de para , ponderado por , a probabilidade de chegar ao estado mudar para(6,6,6,6) j i Ti i j pipij i j . Você pode descobrir os tempos e as probabilidades de acerto através da programação dinâmica. Não é tão difícil, pois existe uma ordem transversal para preencher os tempos e as probabilidades de acerto. Por exemplo, para dois dados: primeiro calcule T ep para (0,0), depois para (1,0), depois (1, 1), (2, 0), depois (2, 1), etc.
Em Python:
fonte
Estimativa rápida e suja de Monte Carlo em R da duração de um jogo para 1 jogador:
Resultados: , , portanto, um intervalo de confiança de 95% para a média é .μ^=14.684 σ^=6.24 [14.645,14.722]
Para determinar a duração de um jogo para quatro jogadores, podemos agrupar as amostras em quatro e ter a duração mínima média de cada grupo (você perguntou sobre o máximo, mas suponho que você quis dizer o mínimo, pois, pelo que li, o o jogo termina quando alguém consegue obter todos os números):
Resultados: , ; portanto, um intervalo de confiança de 95% para a média é .μ^=9.44 σ^=2.26 [9.411,9.468]
fonte
Que tal uma relação recursiva em relação ao número remanescente de lados que você precisa obter para vencer.m
Basicamente, a última relação está dizendo que o número de tempo para rolar os números diferentes restantes é igual a mais:1m 1
A aplicação numérica dessa relação fornece .14.7
fonte
Uma explicação simples e intuitiva para a primeira pergunta:
Você primeiro precisa rolar qualquer número. Isso é fácil, sempre leva exatamente 1 rolo.
Você precisa rolar qualquer número diferente do primeiro. A chance de isso acontecer é ; portanto, serão necessários (1,2) testes em média. 656 65
Você precisará rolar qualquer número que não seja os dois primeiros. A chance de isso acontecer é ; portanto, serão necessários (1,5) testes em média. 646 64
Você precisa rolar qualquer número que não seja os três primeiros. A chance de isso acontecer é , portanto, levará (2) testes em média. 636 63
E assim sucessivamente, até concluirmos com êxito nosso sexto rolo:
Essa resposta é semelhante à resposta de Neil G, apenas, sem a cadeia markov.
fonte
a função densidade de probabilidade (ou equivalente discreto) para obter o próximo número novo é:
f = soma (p * (1 - p) ^ (i - 1), i = 1 .. inf)
onde p é a probabilidade por rolagem, 1 quando nenhum número foi rolado, 5/6 após 1, 4/6. até 1/6 no último número
o valor esperado, mu = soma (i * p * (1 - p) ^ (i - 1), i = 1 .. inf) deixando n = i - 1 e colocando p fora da soma,
mu = p * soma ((n + 1) * (1 - p) ^ n, n = 0 .. inf)
mu = p * soma (n (1-p) ^ n, n = 0 .. inf) + p * soma ((1-p) ^ n, n = 0 .. inf) mu = p * (1-p ) / (1-p-1) ^ 2 + p * 1 / (1- (1-p))
mu = p * (1 - p) / p ^ 2 + p / p
mu = (1 - p) / p + p / p
mu = (1 - p + p) / p
mu = 1 / p
A soma dos valores esperados (mus) para ps de 1, 5/6, 4/6, 3/6, 2/6 e 1/6 é 14,7 conforme relatado anteriormente, mas 1 / p por número necessário é geral, independentemente do tamanho da matriz
Da mesma forma, podemos calcular o desvio padrão analiticamente
sigma ^ 2 = soma ((i - mu) ^ 2 * p * (1 - p) ^ (i - 1), i = 1 .. inf)
Vou poupar a álgebra aqui, mas sigma ^ 2 = (1-p) / p ^ 2
No caso de 6, a soma de sigma ^ 2 para cada etapa é 38,99 para um desvio padrão de cerca de 6,24, novamente, como simulado
fonte
A pergunta 1 foi:
Quantas vezes você tem que jogar um dado de seis lados até obter todos os números pelo menos uma vez?
Obviamente, a resposta correta deve ser "infinita".
fonte