Aqui está a pergunta:
Você lança um dado justo de 6 lados iterativamente até que a soma dos dados seja maior ou igual a M. Qual é a média e o desvio padrão da soma menos M quando M = 300?
Devo escrever um código para responder a esse tipo de perguntas?
Por favor, me dê algumas dicas sobre isso. obrigado!
[self-study]
tag e leia seu wiki . Diga-nos o que você entende até agora, o que tentou e onde está preso. Forneceremos dicas para ajudá-lo a se soltar.Respostas:
Você certamente pode usar código, mas eu não simularia.
Vou ignorar a parte "menos M" (você pode fazer isso com bastante facilidade no final).
Você pode calcular as probabilidades de forma recursiva com muita facilidade, mas a resposta real (com um alto grau de precisão) pode ser calculada a partir de um raciocínio simples.
Deixe os rolos ser . Deixe- S t = Σ t i = 1 X i .X1,X2,... St=∑ti=1Xi
Deixe ser o menor índice de onde S τ ≥ M .τ Sτ≥ M
similarmente
Equações semelhantes à primeira acima poderiam então ser executadas (pelo menos em princípio) até que você atinja qualquer uma das condições iniciais para obter uma relação algébrica entre as condições iniciais e as probabilidades que queremos (o que seria tedioso e não especialmente esclarecedor) , ou você pode construir as equações a seguir correspondentes e executá-las a partir das condições iniciais, o que é fácil de executar numericamente (e foi assim que verifiquei minha resposta). No entanto, podemos evitar tudo isso.
As probabilidades dos pontos estão executando médias ponderadas das probabilidades anteriores; estes (geometricamente rapidamente) suavizarão qualquer variação na probabilidade da distribuição inicial (toda probabilidade no ponto zero no caso do nosso problema). o
Para uma aproximação (muito precisa), podemos dizer que a M - 1 deve ser quase igualmente provável no tempo τ - 1 (realmente próximo a ela) e, portanto, do acima exposto, podemos escrever que as probabilidades serão estar muito perto de estar em proporções simples e, como elas devem ser normalizadas, podemos apenas escrever probabilidades.M- 6 M- 1 τ- 1
Ou seja, podemos ver que, se as probabilidades de começar de a M - 1 eram exatamente iguais, existem 6 maneiras igualmente prováveis de chegar a M , 5 de chegar a M + 1 e assim por diante até 1 maneira de chegar ao M + 5 .M- 6 M- 1 M M+ 1 M+ 5
Ou seja, as probabilidades estão na proporção 6: 5: 4: 3: 2: 1 e somam 1, por isso são triviais para escrever.
Calculá-lo exatamente (até erros numéricos arredondados acumulados) executando as recursões de probabilidade adiante de zero (eu fiz isso em R) fornece diferenças na ordem de≈
.Machine$double.eps
( na minha máquina) a partir da aproximação acima (ou seja, simples o raciocínio ao longo das linhas acima fornece respostas efetivamente exatas , pois elas são tão próximas das respostas calculadas a partir da recursão quanto esperamos que as respostas exatas sejam).2.22e-16
Aqui está o meu código para isso (a maioria está apenas inicializando as variáveis, o trabalho está todo em uma linha). O código inicia após o primeiro lançamento (para me salvar colocando uma célula 0, que é um pequeno incômodo para tratar em R); em cada etapa, pega a célula mais baixa que poderia ser ocupada e avança por um rolo de matriz (espalhando a probabilidade dessa célula pelas próximas 6 células):
(poderíamos usar
rollapply
(fromzoo
) para fazer isso de forma mais eficiente - ou várias outras funções - mas será mais fácil traduzir se eu deixar explícito)Observe que
d6
é uma função de probabilidade discreta entre 1 e 6; portanto, o código dentro do loop na última linha está construindo médias ponderadas em execução dos valores anteriores. É esse relacionamento que suaviza as probabilidades (até os últimos valores nos quais estamos interessados).Então, aqui estão os primeiros 50 valores ímpares (os primeiros 25 valores marcados com círculos). Em cada , o valor no eixo y representa a probabilidade que se acumulou na célula mais posterior antes de a avançarmos para as próximas 6 células.t
Como você vê, ela se suaviza (para , o inverso da média do número de passos que cada rolo de dado leva) muito rapidamente e permanece constante.1 / μ
E quando pressionamos , essas probabilidades desaparecem (porque não estamos colocando a probabilidade para valores em M e além adiante).M M
Portanto, a ideia de que os valores em a M - 6 devem ser igualmente prováveis, porque as flutuações das condições iniciais serão suavizadas, é claramente visto como o caso.M- 1 M- 6
A partir da distribuição de probabilidade, a média e a variação das probabilidades são então simples.
fonte
Os valores iniciais desta sequência são
Computar a média e a variação dessa distribuição é simples e fácil.
R
fonte