Um jogador recebe um dado justo de seis lados. Para vencer, ela deve rolar um número maior que 4 (ou seja, 5 ou 6). Se ela rola um 4, ela deve rolar novamente. Quais são as chances dela de ganhar?
Eu acho que a probabilidade de ganhar pode ser expressa recursivamente como:
Eu aproximada como executando 1 milhão de ensaios em Java, como este:
import java.util.Random;
public class Dice {
public static void main(String[] args) {
int runs = 1000000000;
int wins = 0;
for (int i = 0; i < runs; i++) {
wins += playGame();
}
System.out.println(wins / (double)runs);
}
static Random r = new Random();
private static int playGame() {
int roll;
while ((roll = r.nextInt(6) + 1) == 4);
return (roll == 5 || roll == 6) ? 1 : 0;
}
}
E vejo que se poderia expandir assim:
Mas não sei como resolver esse tipo de relação de recorrência sem recorrer a esse tipo de aproximação. É possível?
probability
tronbabylove
fonte
fonte
Respostas:
Apenas resolva usando álgebra:
fonte
Nota: Esta é uma resposta para a pergunta inicial, e não a recorrência.
Se ela fizer um 4, basicamente não conta, porque o próximo lançamento é independente. Em outras palavras, depois de rolar um 4, a situação é a mesma de quando ela começou. Portanto, você pode ignorar o 4. Os resultados que podem ser importantes são 1-3 e 5-6. Existem 5 resultados distintos, 2 dos quais estão vencendo. Portanto, a resposta é 2/5 = 0,4 = 40%.
fonte
As respostas de dsaxton ( /stats//a/232107/90759 ) e GeoMatt22 ( /stats//a/232107/90759 ) fornecem as melhores abordagens para o problema. Outra é perceber que sua expressão
É realmente uma progressão geométrica :
Em geral, temos
então aqui temos
Obviamente, a maneira de provar a fórmula geral da soma de uma progressão geométrica é usando uma solução algébrica similar a dsaxton.
fonte
Todas as respostas acima estão corretas, mas não explicam por que estão corretas e por que você pode ignorar tantos detalhes e evitar a necessidade de resolver uma complicada relação de recorrência.
A razão pela qual as outras respostas estão corretas é a propriedade Strong Markov , que para uma Cadeia de Markov discreta é equivalente à propriedade regular de Markov. https://en.wikipedia.org/wiki/Markov_property#Strong_Markov_property
Basicamente, a ideia é que a variável aleatória
é um tempo de parada . https://en.wikipedia.org/wiki/Stopping_time Um tempo de parada é uma variável aleatória que não depende de nenhuma informação futura .
You can read more about stopping times and the Strong Markov property in Section 8.3 of (the 4th edition of) Durrett's Probability Theory and Examples, p. 365.
fonte
Another way to look at the problem.
Lets call a 'real result' a 1,2,3,5 or 6.
What is the probability of winning on the first roll, if you got a 'real result'? 2/5
What is the probability of winning on the second roll, if the second roll is the first time you got a 'real result'? 2/5
Same for third, fourth.
So, you can break your sample in (infinte) smaller samples, and those samples all give the same probability.
fonte