Tempo necessário para atingir um padrão de cara e coroa em uma série de lançamentos de moedas

26

Inspirado na palestra de Peter Donnelly no TED , na qual ele discute quanto tempo levaria para um determinado padrão aparecer em uma série de lançamentos de moedas, criei o seguinte script em R. Dado dois padrões 'hth' e 'htt', calcula quanto tempo leva (ou seja, quantas moedas jogam) em média antes de você atingir um desses padrões.

coin <- c('h','t')

hit <- function(seq) {
    miss <- TRUE
    fail <- 3
    trp  <- sample(coin,3,replace=T)
    while (miss) {
        if (all(seq == trp)) {
            miss <- FALSE
        }
        else {
            trp <- c(trp[2],trp[3],sample(coin,1,T))
            fail <- fail + 1
        }
    }
    return(fail)
}

n <- 5000
trials <- data.frame("hth"=rep(NA,n),"htt"=rep(NA,n))

hth <- c('h','t','h')
htt <- c('h','t','t')

set.seed(4321)
for (i in 1:n) {
    trials[i,] <- c(hit(hth),hit(htt))    
}
summary(trials)

As estatísticas de resumo são as seguintes,

      hth             htt        
 Min.   : 3.00   Min.   : 3.000  
 1st Qu.: 4.00   1st Qu.: 5.000  
 Median : 8.00   Median : 7.000  
 Mean   :10.08   Mean   : 8.014  
 3rd Qu.:13.00   3rd Qu.:10.000  
 Max.   :70.00   Max.   :42.000

Na palestra, é explicado que o número médio de lançamentos de moedas seria diferente para os dois padrões; como pode ser visto na minha simulação. Apesar de assistir à palestra algumas vezes, ainda não estou entendendo por que esse seria o caso. Entendo que 'hth' se sobrepõe a si próprio e, intuitivamente, eu pensaria que você digitaria 'hth' antes de 'htt', mas esse não é o caso. Eu realmente apreciaria se alguém pudesse me explicar isso.

r probability stochastic-processes lafrasu
fonte

32

Pense no que acontece na primeira vez em que você obtém um H seguido de um T.

Caso 1: você está procurando HTH e viu HT pela primeira vez. Se o próximo sorteio for H, você terminou. Se for T, você está de volta à estaca zero: desde que os dois últimos lançamentos foram TT, agora você precisa do HTH completo.

Caso 2: você está procurando HTT e viu HT pela primeira vez. Se o próximo sorteio for T, você terminou. Se for H, isso é claramente um revés; no entanto, é menor, pois agora você tem o H e precisa apenas de -TT. Se o próximo sorteio for H, isso não piorará a situação, enquanto T melhora, e assim por diante.

Em outras palavras, no caso 2, o primeiro H que você vê leva você a 1/3 do caminho, e a partir desse momento você nunca precisa começar do zero. Isso não é verdade no caso 1, onde um TT apaga todo o progresso que você fez.

NPE
fonte

Ohh, então neste cenário a troca de moedas não para quando um padrão vence! Isso faz sentido. Isso me confundiu por um tempo (não assisti o TED falar), então pensei em comentar para ajudar outras pessoas que poderiam estar pensando a mesma coisa.

15

$8n+2$ $n$ $n$ $HTH$ $HTH$

Outra maneira de ver isso é que, após atingir "HT", um "T" enviará "HTH" de volta ao início, enquanto um "H" iniciará o progresso para um possível "HTT".

$k$ $k$ $2^k$ $2+0+8=10$ $0+0+8=8$

$5$

Fica pior: no jogo de Penney você escolhe um padrão para correr e depois eu escolho outro. Se você escolher "HTH", eu escolherei "HHT" e tenho chances de vitória de 2: 1; se você escolher "HTT", selecionarei "HHT" novamente e ainda tenho probabilidades de 2: 1 a meu favor. Mas se você escolher "HHT", eu escolherei "THH" e tenho 3: 1 de chances. O segundo jogador sempre pode influenciar as chances, e as melhores escolhas não são transitivas.

Henry
fonte

+1 Obrigado pelo link para o jogo de Penney; mais noites sem dormir :)

lafrasu 21/06

Caro Henry, fiz uma pergunta semelhante neste site e fui instruído a procurar uma resposta aqui. Eu olhei para o jogo de Penney, mas ainda não consigo resolver o meu problema. Qualquer ajuda será apreciada.

SuperAnnoyingUser

14

Eu gosto de desenhar.

insira a descrição da imagem aqui

Esses diagramas são autômatos de estado finito (FSAs). São pequenos jogos infantis (como Chutes e Ladders ) que "reconhecem" ou "aceitam" as seqüências HTT e HTH, respectivamente, movendo um token de um nó para outro em resposta aos lançamentos de moedas. O token começa no nó superior, apontado por uma seta (linha i ). Após cada lançamento da moeda, o token é movido ao longo da borda rotulada com o resultado dessa moeda (H ou T) para outro nó (que chamarei de "nó H" e "nó T", respectivamente). Quando o token atinge um nó do terminal (sem setas de saída, indicadas em verde), o jogo termina e a FSA aceitou a sequência.

Pense em cada FSA como progredindo verticalmente em uma trilha linear. Jogar a sequência "certa" de cara e coroa faz com que o token avance em direção ao seu destino. Jogar um valor "errado" faz com que o token faça backup (ou pelo menos pare). O token faz backup no estado mais avançado correspondente aos lançamentos mais recentes. Por exemplo, o HTT FSA na linha ii permanece na linha ii ao ver uma cabeça, porque essa cabeça pode ser a sequência inicial de um eventual HTH. Ele não percorrer todo o caminho de volta para o início, porque isso seria efetivamente ignorar esta última cabeça completamente.

Depois de verificar esses dois jogos, de fato, correspondem a HTT e HTH conforme reivindicado, e comparando-os linha por linha, e agora deve ser óbvio que é mais difícil vencer o HTH . Eles diferem em sua estrutura gráfica apenas na linha iii , onde um H leva HTT de volta à linha ii (e um T aceita), mas, em HTH, um T nos leva de volta à linha i (e um H aceita). A penalidade na linha iii em jogar HTH é mais severa que a penalidade em jogar HTT.

Isso pode ser quantificado. Eu rotulei os nós desses dois FSAs com o número esperado de lançamentos necessários para aceitação. Vamos chamá-los de nó "valores". A rotulagem começa por

(1) escrevendo o valor óbvio de 0 nos nós aceitantes.

Seja a probabilidade das cabeças p (H) e a probabilidade das caudas seja 1 - p (H) = p (T). (Para uma moeda justa, ambas as probabilidades são iguais a 1/2.) Como cada lançamento de moeda adiciona um ao número de lançamentos,

(2) o valor de um nó é igual a um mais p (H) vezes o valor do nó H mais p (T) vezes o valor do nó T.

Essas regras determinam os valores . É um exercício rápido e informativo para verificar se os valores rotulados (assumindo uma moeda justa) estão corretos. Como exemplo, considere o valor para HTH na linha ii . A regra diz que 8 deve ser 1 a mais que a média de 8 (o valor do nó H na linha i ) e 6 (o valor do nó T na linha iii ): com certeza, 8 = 1 + (1/2) * 8 + (1/2) * 6. Você também pode verificar com facilidade os cinco valores restantes na ilustração.

whuber
fonte

A abordagem da FSA é uma ótima maneira de analisar o jogo de Penney (na resposta de @Henry). Os valores são rotulados de maneira um pouco diferente: o FSA agora tem um nó de aceitação por padrão. Para encontrar a chance de seu padrão ganhar, rotule seu nó de aceitação com 1 e todos os outros nós de aceitação com 0. O valor em qualquer outro nó é igual à média dos valores de seus nós H e T. O valor do nó inicial (exclusivo) é a chance de ganhar.

whuber

0

$0$

Obrigado por capturar isso. Eu consertei o exemplo. No entanto, há um erro de digitação na figura: parece que o valor de HTT na linha iii deve ser 4, em vez de 2.

whuber

4

Algumas ótimas respostas. Gostaria de adotar uma abordagem um pouco diferente e abordar a questão da contra-intuitividade. (Eu concordo bastante, BTW)

Aqui está como eu entendo isso. Imagine uma coluna com resultados seqüenciais aleatórios de sorteio impressos em uma fita de papel, consistindo nas letras "H" e "T".

Arranque arbitrariamente uma seção desta fita e faça uma cópia idêntica.

Em uma determinada fita, a sequência HTH e a sequência HTT ocorrerão com a mesma frequência, se a fita for longa o suficiente.

Mas, ocasionalmente, as instâncias HTH serão executadas juntas, ou seja, HTHTH. (ou mesmo muito ocasionalmente HTHTHTH)

Essa sobreposição não pode ocorrer com instâncias HTT.

Use um marcador para selecionar as "faixas" de resultados bem-sucedidos, HTH em uma fita e HTT na outra. Algumas das faixas HTH serão mais curtas devido à sobreposição. Consequentemente, as lacunas entre eles serão, em média, um pouco mais longas do que na outra fita.

É como esperar um ônibus, quando em média há um a cada cinco minutos. Se os ônibus puderem se sobrepor, o intervalo será um pouco mais longo que cinco minutos, em média, porque em algum momento dois passarão juntos.

Se você chegar em um horário arbitrário, estará esperando um pouco mais pelo próximo (para você, primeiro) ônibus, em média, se eles puderem se sobrepor.

Andrew Troup
fonte

2

Eu estava procurando a intuição para isso no caso inteiro (como estou pesquisando a introdução de Ross aos modelos de probabilidade). Então, eu estava pensando em casos inteiros. Eu achei isso ajudou:

$A$

$B$

$A=B$ $P(A \cap \tilde{B})=0$

$A \ne B$ $P(A \cap \tilde{B}) \ge 0$

Então, deixe-me imaginar que tenho a chance de terminar o padrão no próximo sorteio. Eu desenho o próximo símbolo e ele não termina o padrão. Caso meu padrão não se sobreponha, o símbolo desenhado ainda poderá permitir que eu comece a construir o padrão desde o início novamente.

No caso de uma sobreposição, o símbolo de que eu precisava para terminar meu padrão parcial era o mesmo que eu precisava para começar a reconstruir. Portanto, não posso fazer nenhum dos dois e, portanto, definitivamente vou precisar esperar até o próximo sorteio para ter uma chance de começar a construir novamente.

conjecturas
fonte

Tempo necessário para atingir um padrão de cara e coroa em uma série de lançamentos de moedas

Respostas: