Um dado de 6 lados é rolado iterativamente. Qual é o número esperado de jogadas necessárias para fazer uma soma maior ou igual a K?
Antes da edição
P(Sum>=1 in exactly 1 roll)=1
P(Sum>=2 in exactly 1 roll)=5/6
P(Sum>=2 in exactly 2 rolls)=1/6
P(Sum>=3 in exactly 1 roll)=5/6
P(Sum>=3 in exactly 2 rolls)=2/6
P(Sum>=3 in exactly 3 rolls)=1/36
P(Sum>=4 in exactly 1 roll)=3/6
P(Sum>=4 in exactly 2 rolls)=3/6
P(Sum>=4 in exactly 3 rolls)=2/36
P(Sum>=4 in exactly 4 rolls)=1/216
Após a edição
P(Sum>=1 in atleast 1 roll)=1
P(Sum>=2 in atleast 1 roll)=5/6
P(Sum>=2 in atleast 2 rolls)=1
P(Sum>=3 in atleast 1 roll)=4/6
P(Sum>=3 in atleast 2 rolls)=35/36
P(Sum>=3 in atleast 3 rolls)=1
P(Sum>=4 in atleast 1 roll)=3/6
P(Sum>=4 in atleast 2 rolls)=33/36
P(Sum>=4 in atleast 3 rolls)=212/216
P(Sum>=4 in atleast 4 rolls)=1
Não tenho certeza se isso está correto antes de tudo, mas acho que essa probabilidade está relacionada ao número esperado de rolagens?
Mas não sei como prosseguir. Estou seguindo na direção certa?
self-study
mean
expected-value
dice
saddlepoint-approximation
Suspeito usual
fonte
fonte
Respostas:
Até agora, são apenas algumas idéias para outra abordagem mais exata, com base na mesma observação que minha primeira resposta. Com o tempo vou estender isso ...
Primeiro, alguma notação. Seja um dado inteiro positivo (grande). Queremos a distribuição de N , que é o número mínimo de lança de um dado comuns para obter soma, pelo menos K . Então, em primeiro lugar, definimos X i como o resultado de lance de dados I , e X ( n ) = x 1 + ⋯ + X n . Se pudermos encontrar a distribuição de X ( n ) para todos os n , podemos encontrar a distribuição de N usando P ( N ≥K N K Xi i X(n)=X1+⋯+Xn X(n) n N
e terminamos.
Agora, os valores possíveis para são n , n + 1 , n + 2 , … , 6 n e para k nesse intervalo, para encontrar a probabilidade P ( X 1 + ⋯ + X n = k ) , precisamos encontrar o número total de maneiras de escrever k como uma soma de exatamente n números inteiros, todos no intervalo 1 , 2 , …X1+⋯+Xn n,n+1,n+2,…,6n k P(X1+⋯+Xn=k) k n . Mas isso é chamado de composição inteira restrita, um problema bem estudado em combinatória. Algumas perguntas relacionadas à matemática SE são encontradas em https://math.stackexchange.com/search?q=integer+compositions1,2,…,6
Então, pesquisando e estudando essa literatura combinatória, podemos obter resultados precisos e silenciosos. Vou acompanhar isso, mas depois ...
fonte
Existe uma fórmula simples e fechada em termos das raízes de um polinômio de grau 6.
Na verdade, é um pouco mais fácil considerar um dado justo geral comd≥2 faces rotuladas com os números 1,2,…,d.
Vamosek ser o número esperado de rolos necessários para igualar ou exceder k. Para k≤0, ek=0. Caso contrário, a expectativa é uma mais que a expectativa do número de rolagens para atingir o valor imediatamente anterior, que estaria entre k−d,k−d+1,…,k−1, onde
Essa relação de recorrência linear tem uma solução na forma
ondeλi são as raízes d complexas do polinômio
As constantes deai encontram-se aplicando-se a solução para os valores , onde em todos os casos. Isso fornece um conjunto de equações lineares nas constantes e possui uma solução única. Que a solução funciona pode ser demonstrada verificando a recorrência usando o fato de que toda raiz satisfaz(2) k=−(d−1),−(d−2),…,−1,0 ek=0 d d (1) (3):
Esta solução de formulário fechado nos fornece boas maneiras de aproximar a resposta e também avaliar com precisão. (Para valores pequenos a modestos de a aplicação direta da recorrência é uma técnica computacional eficaz.) Por exemplo, com , podemos calcular prontamentek, d=6
Para aproximações, haverá uma maior raiz única assim, eventualmente (para suficientemente grande ), o termo dominará os termos emO erro diminuirá exponencialmente de acordo com a segunda menor norma das raízes. Continuando o exemplo com o coeficiente de é e a próxima menor norma é (Aliás, o outro tende a ser muito próximo de em tamanho.) Assim, podemos aproximar o valor anterior comoλ+=1 k λk+ d (2). k = 6 , λ + a + = 0,4761905 0,7302500. a i 1k=6, λ+ a+=0.4761905 0.7302500. ai 1
com um erro da ordem de0.7302500106≈10−314368.
Para demonstrar como essa solução é prática, eis oek k d d≫100
R
código que retorna uma função para avaliar para qualquer (dentro do escopo de cálculos de ponto flutuante de precisão dupla) e não muito grande (será atolado uma vez que ):Como exemplo de seu uso, aqui calcula as expectativas parak=1,2,…,16:
O objeto retornado inclui as raízes e seus multiplicadores para análises adicionais. O primeiro componente da matriz de multiplicadores é o coeficiente útilλi ai a+.
(Se você está curioso para que
die
servem os outros parâmetros , executedie(2, 2, 0, c(1,0))$f(1:10)
e veja se reconhece a saída ;-). Essa generalização ajudou no desenvolvimento e no teste da função.)fonte
die
dá um erro para mim:object 'phi' not found
.phi
paraa
) para corresponder ao texto foi o culpado. Eu o corrigi (e verifiquei).não há como obter o número exato exato de rolagens em geral, mas para um K.
Seja N o evento de rolagem esperada para obter soma => K.
para K = 1, E (N) = 1
para K = 2,E(N)=(56+2∗1)/(56+1)=1711
e assim por diante.
Será difícil obter E (N) para K. grande, por exemplo, para K = 20 você precisará esperar (4 rolos, 20 rolos)
O Teorema do Limite Central será mais beneficiado com alguma% de confiança. como sabemos que a ocorrência é distribuída uniformemente, para grandes valores de K. (Distribuição Normal)
Agora você precisa de "N" para obter Sum pelo menos K .... nós o convertemos na distribuição normal padrão. onde % Você pode obter valores Z em "Tabelas normais padrão" ou daqui, por exemplo
Você conhece K, Z (com qualquer erro) ........, então você pode obter N = E (N) com alguma% de confiança resolvendo a equação.
fonte
Vou dar um método para encontrar uma solução aproximada. Primeiro, seja a variável aleatória, "resultado do lançamento com os dados" e seja o número de jogadas necessárias para atingir uma soma pelo menos . Então temos que , para encontrar a distribuição de , precisamos encontrar as convoluções das distribuições do para , para todos os . Essas convulsões podem ser encontradas numericamente, mas para grandesXi i N k P(N≥n)=P(X1+X2+⋯+Xn≤k) N Xi i=1,2,…,n n n pode ser muito trabalhoso, então tentamos aproximar a função de distribuição cumulativa para as convoluções, usando métodos de ponto de sela. Para outro exemplo de métodos de ponto de sela, consulte minha resposta à soma genérica de variáveis aleatórias gama
Usaremos a aproximação de Lugannini-Rice para o caso discreto e segue R Butler: "Aproximações do ponto de sela com aplicações", página 18 (segunda correção de continuidade). Primeiro, precisamos da função geradora de momento do , que é Então a função geradora cumulante para a soma de dados independentes se torna e também precisamos das primeiras derivadas de , mas as encontraremos simbolicamente usando R. O código é o seguinte:Xi M(T)=EetXi=16(et+e2t+e3t+e4t+e5t+e6t) n Kn(t)=n⋅log(16∑i=16eit) K
Em seguida, devemos resolver a equação do ponto de sela.
Isso é feito pelo seguinte código:
Observe que o código acima não é muito robusto, pois valores de distantes em qualquer parte da distribuição não funcionarão. Então, algum código para o cálculo real da função de probabilidade da cauda, aproximadamente, pela aproximação de Luganini-Rice, seguindo Butler, página 18, (segunda correção de continuidade):k
Função para retornar a probabilidade da cauda:
#
Vamos tentar usar isso para calcular uma tabela da distribuição, com base na fórmula que é a função do código R acima.P(N≥n)=P(X1+X2+⋯+Xn≤k)=1−P(X1+⋯+Xn≥k+1)=1−G(n,k+1) G
Agora, vamos responder à pergunta original com . Então o número mínimo de rolos é 4 e o número máximo de rolos é 20. A probabilidade de que sejam necessários 20 rolos é muito pequena e pode ser calculada exatamente a partir da fórmula binomial, deixo isso para o leitor. (a aproximação acima não funcionará para ).K=20 n=20
Portanto, a probabilidade de ser aproximada porN≥19
A probabilidade de ser aproximada por:N≥10
E assim por diante. Usando tudo isso, você pode obter uma aproximação para a expectativa. Isso deve ser muito melhor do que as aproximações baseadas no teorema do limite central.
fonte