Estou trabalhando para aprender probabilidades e estatísticas lendo alguns livros e escrevendo algum código e, ao simular lançamentos de moedas, notei algo que me pareceu um pouco contrário à intuição ingênua de alguém. Se você jogar uma moeda justa vezes, a proporção entre cara e coroa converge para 1 quando aumenta, exatamente como você esperaria. Mas, por outro lado, à medida que aumenta, parece que você tem menos probabilidade de virar exatamente o mesmo número de caras que as caudas, obtendo uma proporção de exatamente 1.
Por exemplo (alguma saída do meu programa)
For 100 flips, it took 27 experiments until we got an exact match (50 HEADS, 50 TAILS)
For 500 flips, it took 27 experiments until we got an exact match (250 HEADS, 250 TAILS)
For 1000 flips, it took 11 experiments until we got an exact match (500 HEADS, 500 TAILS)
For 5000 flips, it took 31 experiments until we got an exact match (2500 HEADS, 2500 TAILS)
For 10000 flips, it took 38 experiments until we got an exact match (5000 HEADS, 5000 TAILS)
For 20000 flips, it took 69 experiments until we got an exact match (10000 HEADS, 10000 TAILS)
For 80000 flips, it took 5 experiments until we got an exact match (40000 HEADS, 40000 TAILS)
For 100000 flips, it took 86 experiments until we got an exact match (50000 HEADS, 50000 TAILS)
For 200000 flips, it took 96 experiments until we got an exact match (100000 HEADS, 100000 TAILS)
For 500000 flips, it took 637 experiments until we got an exact match (250000 HEADS, 250000 TAILS)
For 1000000 flips, it took 3009 experiments until we got an exact match (500000 HEADS, 500000 TAILS)
Minha pergunta é a seguinte: existe um conceito / princípio na teoria estatística / probabilidade que explique isso? Em caso afirmativo, que princípio / conceito é esse?
Link para o código, se alguém estiver interessado em ver como eu gerou isso.
- editar -
Pelo que vale, aqui está como eu estava explicando isso para mim mesma antes. Se você jogar uma moeda justa vezes e contar o número de caras, estará basicamente gerando um número aleatório. Da mesma forma, se você fizer a mesma coisa e contar as caudas, também estará gerando um número aleatório. Portanto, se você contar os dois, estará gerando dois números aleatórios e, à medida que aumenta, os números aleatórios aumentam. E quanto maiores os números aleatórios que você gerar, maiores serão as chances de eles "sentirem falta" um do outro. O que torna isso interessante é que os dois números estão realmente ligados em certo sentido, com sua proporção convergindo para um à medida que aumentam, mesmo que cada número seja aleatoriamente isolado. Talvez seja só eu, mas acho esse tipo de coisa legal.
fonte
Respostas:
Observe que o caso em que o número de caras e o número de caudas são iguais é o mesmo que "exatamente metade do tempo que você recebe caras". Então, vamos continuar contando o número de cabeças para ver se é metade do número de lançamentos ou comparar equivalentemente a proporção de cabeças com 0,5.
Quanto mais você virar, maior será o número de contagens possíveis de cabeças - a distribuição se tornará mais espalhada (por exemplo, um intervalo para o número de cabeças contendo 95% da probabilidade aumentará à medida que o número de lançamentos aumentar) , então a probabilidade de exatamente meia cabeça tende a diminuir à medida que lançamos mais.
Da mesma forma, a proporção de cabeças terá mais valores possíveis; veja aqui, onde passamos de 100 lançamentos para 200 lançamentos:
Com 100 jogadas, podemos observar uma proporção de 0,49 cabeças ou 0,50 cabeças ou 0,51 cabeças (e assim por diante - mas nada entre esses valores), mas com 200 jogadas, podemos observar 0,49 ou 0,495 ou 0,50 ou 0,50 ou 0,510 - o a probabilidade tem mais valores para "cobrir" e, portanto, cada um tenderá a receber uma parcela menor.
Considere que você tem lançamentos com alguma probabilidade p i de obter i heads (conhecemos essas probabilidades, mas não é crítica para esta parte) e você adiciona mais dois lançamentos. Em 2 n arremessos, n cabeças é o resultado mais provável ( p n > p n ± 1 e desce a partir daí).2n pi i 2n n pn>pn±1
Qual é a chance de ter cabeças em 2 n + 2 jogadas?n+1 2n+2
(Marque essas probabilidades com para não confundi-las com as anteriores; também permita que P (HH) seja a probabilidade de "Cabeça, cabeça" nos próximos dois lançamentos, e assim por diante)q
ou seja, se você adicionar mais dois sorteios, a probabilidade do valor médio diminui naturalmente porque calcula a média do valor mais provável (médio) com a média dos valores menores de cada lado)
Portanto, desde que você esteja confortável, o pico estará no meio (por ), A probabilidade de exatamente metade cabeças deve diminuir à medida que n aumenta.2n=2,4,6,... n
De fato, podemos mostrar que, para grandes , p n diminui proporcionalmente com 1n pn (sem surpresa, uma vez que a distribuição do número padronizado de cabeças se aproxima da normalidade e a variação da proporção de cabeças diminui comn).1n√ n
As requested, here's R code that produces something close to the above plot:
fonte
Bem, sabemos que a Lei dos Grandes Números é o que garante a primeira conclusão de sua experiência, a saber: se você jogar uma moeda justa vezes, a proporção de caras e coroas converge para 1 à medida que n aumenta.n n
Portanto, não há problemas lá. No entanto, isso sobre toda a Lei dos Grandes Números nos diz neste cenário.
Mas agora, pense sobre esse problema de maneira mais intuitiva. Pense em jogar uma moeda um pequeno número de vezes, por exemplo: .n=2,4,8,10
Quando você joga uma moeda duas vezes, ou seja, , pense nos possíveis cenários dos dois lançamentos. (Aqui H indicará cabeças e T representará caudas). No flip punho você poderia ter começado H e na segunda aleta você poderia ter começado T . Mas essa é apenas uma das maneiras pelas quais os dois lançamentos poderiam ter surgido. Você também poderia ter chegado no primeiro flip T e no segundo flip H , e todas as outras combinações possíveis. Portanto, no final do dia, quando você joga 2 moedas, as combinações possíveis que você pode ver nos dois lançamentos são S = { H H , H T ,n=2 H T H T T H
e, portanto, existem 4 cenários possíveis para jogar n = 2 moedas.
Se você fosse para virar 4 moedas, em seguida, o número possível de combinações que você poderia ver seria e assim existem 16 possíveis cenários para inversão n = 4 moedas.
Jogar moedas leva a 256 combinações.n=8
O lançamento de moedas leva a 1.024 combinações.n=10
E, em particular, inverter qualquer número moedas leva a 2 n combinações possíveis.n 2n
Agora, vamos tentar abordar esse ponto de vista probabilístico do problema. Olhando para o caso em que , sabemos que a probabilidade de obter exatamente o mesmo número de cara e coroa (ou seja, como você coloca uma razão de exatamente 1) é P r ( razão de exatamente 1 ) = 2n=2
Quandon=4, sabemos que a probabilidade de obter exatamente o mesmo número de cara e coroa é
Pr(razão de exatamente 1)=6
E, em geral, como tende a crescer, temos que a probabilidade de obter exatamente o mesmo número de caras e coroas vai para 0.n
Em outras palavras, como , temos esse P r ( razão exatamente de 1 ) → 0n→∞
E assim, para responder sua pergunta. Realmente o que você está observando é apenas uma conseqüência do fato de que haverá muito mais combinações de lançamentos de moedas em que o número de caras e coroas não é igual em comparação com o número de combinações em que são iguais.
Como @ Mark L. Stone sugere, se você se sentir confortável com a fórmula binomial e as variáveis aleatórias binomiais, poderá usá-lo para mostrar o mesmo argumento.
fonte
Veja o triângulo de Pascal.
A probabilidade de resultados de troca de moedas é representada pelos números ao longo da linha inferior. O resultado de igual cara e coroa é o número do meio. À medida que a árvore aumenta, o número do meio se torna uma proporção menor da soma da linha inferior.
fonte
Talvez ajude a delinear que isso está relacionado à lei do arco-seno. Ele diz que, para um caminho de resultados, a probabilidade de que o caminho permaneça a maior parte do tempo no domínio positivo ou negativo é muito maior do que está subindo e descendo do que o esperado da intuição . Aqui estão alguns links:
http://www.math.unl.edu/~sdunbar1/ProbabilityTheory/Lessons/BernoulliTrials/ExcessHeads/excessheads.shtml
https://en.wikipedia.org/wiki/Arcsine_law
fonte
Enquanto a proporção de caras e caudas converge para 1, o intervalo de números possíveis se torna maior. (Estou inventando os números). Digamos que para 100 jogadas, a probabilidade é de 90% de que você tenha entre 45% e 55% de cabeças. Isso é 90% que você tem de 45 a 55 cabeças. 11 possibilidades para o número de cabeças. Aproximadamente 9% aproximadamente que você obtém números iguais de cara e coroa.
Digamos que para 10.000 arremessos, a probabilidade é de 95% de que você tenha entre 49% e 51% de cabeças. Portanto, a proporção chegou muito perto de 1. Mas agora você tem entre 4.900 e 5.100 cabeças. 201 possibilidades. A chance de números iguais é de apenas cerca de 0,5%.
E com um milhão de arremessos, você tem certeza de ter entre 49,9% e 50,1% de cabeças. Isso varia de 499.000 a 501.000 cabeças. 2.001 possibilidades. A chance agora caiu para 0,05%.
Ok, a matemática foi inventada. Mas isso deve lhe dar uma idéia sobre o "porquê". Embora a proporção se aproxime de 1, o número de possibilidades se torna maior, de modo que atingir exatamente meia cabeça, meia coroa, se torna cada vez menos provável.
Outro efeito prático: Na prática, é improvável que você tenha uma moeda em que a probabilidade de lançar cabeças seja exatamente de 50%. Pode ser 49,99371% se você tiver uma moeda muito boa. Para um pequeno número de arremessos, isso não faz diferença. Para números grandes, a porcentagem de cabeças convergirá para 49,99371%, e não 50%. Se o número de arremessos for grande o suficiente, arremessar 50% ou mais das cabeças se tornará muito, muito improvável.
fonte
Bem, uma coisa a se notar é que, com um número par de jogadas (caso contrário, a probabilidade de jogadas iguais de cara e coroa é exatamente igual a zero), o resultado mais provável será sempre aquele com tantas jogadas de cabeça quanto coroa.
A distribuição den flips é dado pelos coeficientes do polinômio
Usando a aproximação de Stirling paran ! , você chega a algo como
fonte
Suppose you flip a coin twice. There are four possible outcomes: HH, HT, TH, and TT. In two of these, you have an equal number of heads and tails, so there's a 50% chance that you get the same number of heads and tails.
Now suppose you flip a coin 4,306,492,102 times. Do you expect a 50 percent chance that you'll wind up with exactly 2,153,246,051 heads and 2,153,246,051 tails?
fonte