Estou jogando um dado justo. Sempre que recebo 1, 2 ou 3, escrevo um '1'; sempre que recebo um 4, escrevo um '2'; sempre que recebo um 5 ou um 6, escrevo um '3'.
Seja o número total de jogadas necessárias para o produto de todos os números que escrevi como . Eu quero calcular (ou aproximar) , e uma aproximação pode ser dada como uma função da distribuição Normal.
Primeiro, eu sei que porque . Agora, , e sejam o número de vezes que escrevi a 1, 2 e 3, respectivamente. Então:
O que eu quero calcular é:
Como faço para calcular isso?
--EDITAR:
Por isso, foi sugerido que eu pudesse substituir a condição por:
onde , , e .
Isso parece mais solucionável! Infelizmente ainda não tenho idéia de como resolvê-lo.
probability
normal-distribution
conditional-probability
multinomial
distributions
Pedro Carvalho
fonte
fonte
Respostas:
A presente questão é um caso específico em que você está lidando com uma quantidade que é uma função linear de uma variável aleatória multinomial. É possível resolver seu problema exatamente, enumerando as combinações multinomiais que satisfazem a desigualdade necessária e somando a distribuição nesse intervalo. No caso em que é grande, isso pode se tornar computacionalmente inviável. Nesse caso, é possível obter uma distribuição aproximada usando a aproximação normal ao multinomial. Uma versão generalizada dessa aproximação é mostrada abaixo e, em seguida, é aplicada ao seu exemplo específico.N
Problema geral de aproximação: suponha que tenhamos uma sequência de variáveis aleatórias permutáveis com intervalo . Para qualquer , podemos formar o vetor de contagem , que conta o número de ocorrências de cada resultado nos primeiros valores da sequência. Como a sequência subjacente é intercambiável, o vetor count é distribuído como:1,2,...,m n∈N X≡X(n)≡(X1,X2,...,Xm) n
Agora, suponha que tenhamos algum vetor de pesos não negativos e usamos esses pesos para definir a função linear:w=(w1,w2,...,wm)
Como os pesos não são negativos, essa nova quantidade não diminui em . Em seguida, definimos o número , que é o menor número de observações necessárias para obter um valor mínimo especificado para nossa função linear. Queremos aproximar a distribuição de no caso em que esse valor é (estocástico) grande.n N(a)≡min{n∈N|A(n)⩾a} N(a)
Resolvendo o problema geral de aproximação: Primeiramente, observamos que, como não diminui em (o que vale porque assumimos que todos os pesos são não negativos), temos:A(n) n
Assim, a distribuição de está directamente relacionada com a distribuição de . Supondo que a quantidade anterior seja grande, podemos aproximar a distribuição da última substituindo o vetor aleatório discreto por uma aproximação contínua a partir da distribuição normal multivariada. Isso leva a uma aproximação normal para a quantidade linear , e podemos calcular diretamente os momentos dessa quantidade. Para fazer isso, usamos o fato de que , e para . Com alguma álgebra básica, isso nos dá:N A X A(n) E(Xi)=nθi V(Xi)=nθi(1−θi) C(Xi,Xj)=−nθiθj i≠j
Tomar a aproximação normal do multinomial agora nos dá a distribuição aproximada . A aplicação desta aproximação produz:A(n) ~ N(nμ,nμ(1−μ))
(O símbolo é a notação padrão para a função de distribuição normal padrão.) É possível aplicar esta aproximação para encontrar probabilidades referentes à quantidade para um valor especificado de . Essa é uma aproximação básica que não tentou incorporar a correção de continuidade nos valores dos valores subjacentes da contagem multinomial. É obtido fazendo uma aproximação normal usando os mesmos dois primeiros momentos centrais da função linear exata.Φ N(a) a
Aplicação para o seu problema: No seu problema, você tem probabilidades , pesos e o valor de corte . Portanto, você tem (arredondamento para seis casas decimais) . Aplicando a aproximação acima, temos (arredondando para seis casas decimais):θ=(12,16,13) w=(0,ln2,ln3) a=ln100000 μ=16ln2+13ln3=0.481729
Pela aplicação da distribuição multinomial exata, somando todas as combinações que atendem ao requisito , pode-se mostrar que o resultado exato é . Portanto, podemos ver que a aproximação está bem próxima da resposta exata no presente caso.P(A(24)<a) P(N(a)⩾25)=0.483500
Esperamos que esta resposta lhe dê uma resposta para sua pergunta específica, além de colocá-la em uma estrutura mais geral de resultados probabilísticos que se aplicam a funções lineares de vetores aleatórios multinomiais. O presente método deve permitir que você obtenha soluções aproximadas para problemas do tipo geral que você está enfrentando, permitindo variações nos números específicos em seu exemplo.
fonte
Vamos fazer uma aproximação normal.
Primeiro, vamos reformular completamente o seu problema nos logs. Você começa em 0 no tempo t = 0. Em seguida, em cada etapa, você adiciona:
0 com probabilidade 1/2
Você interrompe esse processo quando sua soma excede , momento em que analisa quantas jogadas efetuadas. O número de jogadas que você levou para chegar a esse ponto é ^log(105) N
Minha calculadora me diz que a média dos seus incrementos é: e que a variação é . Para referência, o ponto final é de portanto, chegaremos a ele em aproximadamente 24 etapas≈0.48 ≈0.25 ≈11.51
Dependendo do fato de termos realizado 25 etapas, a distribuição da soma é aproximadamente um gaussiano centrado em 12,0 e com variação 6,25. Isso nos dá uma aproximação gaussiana aproximada dep(N≥25)≈0.5
Você precisaria observar os cumulantes da soma em N = 25 para saber se a aproximação gaussiana está correta ou não. Dado que os incrementos não são simétricos, o aprox pode não ser o melhor
fonte