Inspirado na palestra de Peter Donnelly no TED , na qual ele discute quanto tempo levaria para um determinado padrão aparecer em uma série de lançamentos de moedas, criei o seguinte script em R. Dado dois padrões 'hth' e 'htt', calcula quanto tempo leva (ou seja, quantas moedas jogam) em média antes de você atingir um desses padrões.
coin <- c('h','t')
hit <- function(seq) {
miss <- TRUE
fail <- 3
trp <- sample(coin,3,replace=T)
while (miss) {
if (all(seq == trp)) {
miss <- FALSE
}
else {
trp <- c(trp[2],trp[3],sample(coin,1,T))
fail <- fail + 1
}
}
return(fail)
}
n <- 5000
trials <- data.frame("hth"=rep(NA,n),"htt"=rep(NA,n))
hth <- c('h','t','h')
htt <- c('h','t','t')
set.seed(4321)
for (i in 1:n) {
trials[i,] <- c(hit(hth),hit(htt))
}
summary(trials)
As estatísticas de resumo são as seguintes,
hth htt
Min. : 3.00 Min. : 3.000
1st Qu.: 4.00 1st Qu.: 5.000
Median : 8.00 Median : 7.000
Mean :10.08 Mean : 8.014
3rd Qu.:13.00 3rd Qu.:10.000
Max. :70.00 Max. :42.000
Na palestra, é explicado que o número médio de lançamentos de moedas seria diferente para os dois padrões; como pode ser visto na minha simulação. Apesar de assistir à palestra algumas vezes, ainda não estou entendendo por que esse seria o caso. Entendo que 'hth' se sobrepõe a si próprio e, intuitivamente, eu pensaria que você digitaria 'hth' antes de 'htt', mas esse não é o caso. Eu realmente apreciaria se alguém pudesse me explicar isso.
fonte
Outra maneira de ver isso é que, após atingir "HT", um "T" enviará "HTH" de volta ao início, enquanto um "H" iniciará o progresso para um possível "HTT".
Fica pior: no jogo de Penney você escolhe um padrão para correr e depois eu escolho outro. Se você escolher "HTH", eu escolherei "HHT" e tenho chances de vitória de 2: 1; se você escolher "HTT", selecionarei "HHT" novamente e ainda tenho probabilidades de 2: 1 a meu favor. Mas se você escolher "HHT", eu escolherei "THH" e tenho 3: 1 de chances. O segundo jogador sempre pode influenciar as chances, e as melhores escolhas não são transitivas.
fonte
Eu gosto de desenhar.
Esses diagramas são autômatos de estado finito (FSAs). São pequenos jogos infantis (como Chutes e Ladders ) que "reconhecem" ou "aceitam" as seqüências HTT e HTH, respectivamente, movendo um token de um nó para outro em resposta aos lançamentos de moedas. O token começa no nó superior, apontado por uma seta (linha i ). Após cada lançamento da moeda, o token é movido ao longo da borda rotulada com o resultado dessa moeda (H ou T) para outro nó (que chamarei de "nó H" e "nó T", respectivamente). Quando o token atinge um nó do terminal (sem setas de saída, indicadas em verde), o jogo termina e a FSA aceitou a sequência.
Pense em cada FSA como progredindo verticalmente em uma trilha linear. Jogar a sequência "certa" de cara e coroa faz com que o token avance em direção ao seu destino. Jogar um valor "errado" faz com que o token faça backup (ou pelo menos pare). O token faz backup no estado mais avançado correspondente aos lançamentos mais recentes. Por exemplo, o HTT FSA na linha ii permanece na linha ii ao ver uma cabeça, porque essa cabeça pode ser a sequência inicial de um eventual HTH. Ele não percorrer todo o caminho de volta para o início, porque isso seria efetivamente ignorar esta última cabeça completamente.
Depois de verificar esses dois jogos, de fato, correspondem a HTT e HTH conforme reivindicado, e comparando-os linha por linha, e agora deve ser óbvio que é mais difícil vencer o HTH . Eles diferem em sua estrutura gráfica apenas na linha iii , onde um H leva HTT de volta à linha ii (e um T aceita), mas, em HTH, um T nos leva de volta à linha i (e um H aceita). A penalidade na linha iii em jogar HTH é mais severa que a penalidade em jogar HTT.
Isso pode ser quantificado. Eu rotulei os nós desses dois FSAs com o número esperado de lançamentos necessários para aceitação. Vamos chamá-los de nó "valores". A rotulagem começa por
Seja a probabilidade das cabeças p (H) e a probabilidade das caudas seja 1 - p (H) = p (T). (Para uma moeda justa, ambas as probabilidades são iguais a 1/2.) Como cada lançamento de moeda adiciona um ao número de lançamentos,
Essas regras determinam os valores . É um exercício rápido e informativo para verificar se os valores rotulados (assumindo uma moeda justa) estão corretos. Como exemplo, considere o valor para HTH na linha ii . A regra diz que 8 deve ser 1 a mais que a média de 8 (o valor do nó H na linha i ) e 6 (o valor do nó T na linha iii ): com certeza, 8 = 1 + (1/2) * 8 + (1/2) * 6. Você também pode verificar com facilidade os cinco valores restantes na ilustração.
fonte
Algumas ótimas respostas. Gostaria de adotar uma abordagem um pouco diferente e abordar a questão da contra-intuitividade. (Eu concordo bastante, BTW)
Aqui está como eu entendo isso. Imagine uma coluna com resultados seqüenciais aleatórios de sorteio impressos em uma fita de papel, consistindo nas letras "H" e "T".
Arranque arbitrariamente uma seção desta fita e faça uma cópia idêntica.
Em uma determinada fita, a sequência HTH e a sequência HTT ocorrerão com a mesma frequência, se a fita for longa o suficiente.
Mas, ocasionalmente, as instâncias HTH serão executadas juntas, ou seja, HTHTH. (ou mesmo muito ocasionalmente HTHTHTH)
Essa sobreposição não pode ocorrer com instâncias HTT.
Use um marcador para selecionar as "faixas" de resultados bem-sucedidos, HTH em uma fita e HTT na outra. Algumas das faixas HTH serão mais curtas devido à sobreposição. Consequentemente, as lacunas entre eles serão, em média, um pouco mais longas do que na outra fita.
É como esperar um ônibus, quando em média há um a cada cinco minutos. Se os ônibus puderem se sobrepor, o intervalo será um pouco mais longo que cinco minutos, em média, porque em algum momento dois passarão juntos.
Se você chegar em um horário arbitrário, estará esperando um pouco mais pelo próximo (para você, primeiro) ônibus, em média, se eles puderem se sobrepor.
fonte
Eu estava procurando a intuição para isso no caso inteiro (como estou pesquisando a introdução de Ross aos modelos de probabilidade). Então, eu estava pensando em casos inteiros. Eu achei isso ajudou:
Então, deixe-me imaginar que tenho a chance de terminar o padrão no próximo sorteio. Eu desenho o próximo símbolo e ele não termina o padrão. Caso meu padrão não se sobreponha, o símbolo desenhado ainda poderá permitir que eu comece a construir o padrão desde o início novamente.
No caso de uma sobreposição, o símbolo de que eu precisava para terminar meu padrão parcial era o mesmo que eu precisava para começar a reconstruir. Portanto, não posso fazer nenhum dos dois e, portanto, definitivamente vou precisar esperar até o próximo sorteio para ter uma chance de começar a construir novamente.
fonte