É possível estimar as chances de ganhar um concurso de entradas múltiplas, quando não conheço o detalhamento das inscrições?

8

Suponha que eu participe de um concurso com as seguintes regras:

  • Cada pessoa pode receber até 6 entradas
  • Todas as entradas serão agrupadas e 25% das entradas serão selecionadas para serem vencedores, com um máximo de 25.
  • Cada pessoa pode ganhar apenas uma vez, independentemente do número de entradas. Se o nome de alguém for desenhado novamente, ele será descartado e um novo nome será desenhado.
  • Sei quantas entradas tenho (no máximo, 6)
  • Eu sei quantas entradas totais existem, discriminadas por tipo de entrada
  • Eu não sei como muitas das entradas são entradas repetidas pela mesma pessoa.

A contagem de entradas por tipo é a seguinte:

Tipo 1: 42 Tipo 2: 72 Tipo 3: 119 Tipo 4: 217 Tipo 5: 156 Tipo 6: 178

É possível estimar minhas chances de ganhar nesta situação? Estou um pouco confuso pelo fato de não poder prever como os vencedores iniciais afetarão minhas chances, pois não sei quantas entradas cada vencedor removerá do pool.

Estou interessado na solução, dado o conjunto de dados, mas também estou interessado no procedimento / algoritmo adequado para calculá-lo.

agent86
fonte
O que significam os "tipos"?
macro
@Marco Os diferentes tipos de ingressos que você pode ganhar. Então você pode ganhar tipos de bilhetes de loteria de 1 a 6, e 42 pessoas ganharam tipo de bilhete 1
Rachel
Tenho problemas para seguir a sequência de postagens, porque elas são executadas de baixo para cima. Mas, dado o tempo à direita do nome dos pôsteres, acho que descobri isso. Alguém poderia me dizer se eu entendi direito. Eu acho que a resposta do whuber não pode estar certa por causa da ambiguidade entre entradas e participantes. A estratégia de Rachel para obter o pior e o melhor cenário é correta, mas ela cometeu um erro de matemática adicionando porcentagens quando elas podem ser baseadas em diferentes denominadores. Portanto, se corrigirmos esse erro, teremos os limites certos para a solução.
Michael R. Chernick
Achei estranho que Rachel se referisse ao melhor cenário como aquele que apresentava a maior porcentagem de vitórias e, no pior caso, o que apresentava a menor. Vencer é bom, certo? O último ponto que eu gostaria de esclarecer: o Cardeal afirma que, neste caso, 25% dos participantes excede 25, então haverá apenas 25 vencedores. Ele entende isso sabendo que pelo menos 178 pessoas são inscritas e, é claro, quando o número de participantes excede 100, o total de vencedores é cortado em 25 com base nas regras.
Michael R. Chernick
@ cardinal como surgiu o número 178? Eu adicionei todas as entradas por tipos para obter um total de 784. Na pior das hipóteses, para mim, como jogador, todos receberam 6 entradas e 784/6 = 130,7. Então concluo que deve haver pelo menos 130 entradas. Isso ainda significa que o ponto de corte de 25 se aplica, mas como você chegou ao número mais alto?
Michael R. Chernick

Respostas:

6

As chances possíveis estão entre 17,7% e 18,7%.

O pior caso ocorre quando todos, exceto você, têm exatamente uma entrada na loteria: essa é uma configuração consistente com os dados (embora improvável!).

Vamos contar o número de possibilidades em que você não ganha. Este é o número de maneiras de obter tickets dos tickets restantes, dados pelo coeficiente Binomial . (É um número enorme). O número total de possibilidades - todas elas igualmente prováveis ​​em um desenho justo - é . A proporção simplifica para , que é de cerca de 82,22772%: suas chances de não ganhar. Portanto, suas chances de ganhar nesta situação são iguais a 1 - 82,22772% = 17,7228% .784 - 6257846(784625)(78425)(78425)(78430)/[(784)(7845)]

O melhor caso ocorre quando há o menor número possível de pessoas envolvidas na loteria e o maior número possível possui e, em seguida , , etc. Dado que a "gema" conta (em ordem crescente), isso implica65(42,72,119,156,178,217)

  • No máximo pessoas podem ter entradas cada.42=a66

  • No máximo pessoas podem ter entradas cada.7242=30=a55

    ...

  • No máximo pessoas podem ter entradas cada.178156=22=a22

  • 217178=39=a1 pessoas têm entrada cada.1

Permita que designe a chance de ganhar quando você detém (entre e ) bilhetes em uma loteria com dados e empates. O número total de tickets, portanto, é igual a . Considere o próximo sorteio. Existem sete possibilidades:p(a,l,j)j16a=(a1,a2,,a6)l=251a1+2a2++6a6=n

  1. Um dos seus ingressos está sorteado; você ganha. A chance disso é igual a .j/n

  2. Os bilhetes de outra pessoa estão lotados. A chance disso é igual a . Se eles detiverem , todos os bilhetes serão removidos da loteria. Se , o desenho continua com os novos dados: foi diminuído em e também foi diminuído em . A chance de uma pessoa com bilhetes na loteria ser escolhida, dado que o seu não é, é igual a . Isso fornece seis possibilidades disjuntas para .(nj)/niil1l1ai1iiai/(nj)i=1,2,,6

Adicionamos essas chances porque elas particionam todos os resultados sem sobreposição.

O cálculo continua recursivamente nessa árvore de probabilidade até que todas as folhas em sejam atingidas. É muita computação (cerca de = 244 milhões de cálculos), mas leva apenas alguns minutos (ou menos, dependendo da plataforma). Eu obtenho 18.6475% de chances de ganhar neste caso.l=0256

Aqui está o código do Mathematica que eu usei. (Ele é escrito em paralelo a análise precedente, que poderia ser feito um pouco mais eficiente através de algumas reduções algébricas e testes para quando é reduzida a ). Aqui, o argumento é que não contar os bilhetes que você espera: dá a distribuição da contagem de ingressos que todo mundo tem.ai0aj

p[a_, l_Integer, j_Integer] /; l >= 1 := p[a, l, j] = Module[{k = Length[a], n},
    n = Range[k] . a + j;
    j/n + (n - j)/n ParallelSum[
       i a[[i]] / (n - j) p[a - UnitVector[k, i], l - 1, j], {i, 1, k}]
    ];
p[a_, 0, j_Integer] := 0;
(* The data *)
a = Reverse[Differences[Prepend[Sort[{42, 72, 119, 217, 156, 178}], 0]]];
j = 6; l = 25;
(* The solution *)
p[a - UnitVector[Length[a],j], l, j] // N

Como verificação da realidade, vamos comparar essas respostas com duas aproximações ingênuas (nenhuma das quais está correta):

  1. 25 empates com 6 ingressos em jogo devem lhe dar cerca de 6 * 25 das 784 chances de ganhar. Isso é de 19,1%.

  2. Cada vez que sua chance de não ganhar é de (784-6) / 784. Aumente isso para o 25º poder para encontrar sua chance de não ganhar na loteria. Subtraindo-o de 1, obtém-se 17,5%.

Parece que estamos no estádio certo.

whuber
fonte
1
Eu gosto desse problema porque ele fornece um exemplo real de dois tipos de incerteza: incerteza probabilística na loteria e falta de conhecimento sobre a verdadeira distribuição da propriedade do bilhete na loteria. Tratei efetivamente a última incerteza usando a análise de intervalo, que simplesmente tenta limitar as possibilidades da maneira mais rígida possível. Outros podem seguir em frente e adotar alguma distribuição prévia para descrever essa incerteza epistêmica, mas não consigo conceber nenhuma maneira válida de justificar tal prioritário, dada a informação disponível.
whuber
Mas você está assumindo que ninguém pode ter 2 ou mais ingressos de qualquer tipo específico ("gem"). Tanto quanto posso ver, isso não está especificado na descrição do problema dos OPs (agent86s).
Michael R. Chernick
@ Michael Você está certo, não está perfeitamente claro nas regras do jogo, embora esteja fortemente implícito que ninguém coleciona mais de um de cada tipo de gema. Vide regra 1 da pergunta original: "todas as pessoas podem receber até 6 entradas".
whuber
1
Tanto quanto sei (e foi demonstrado durante o concurso), a suposição das informações fornecidas está correta - ninguém pode ter mais de 6 inscrições, uma de cada "tipo".
agent86
1
Muito obrigado por reservar um tempo para responder a isso! Estou pensando neste problema desde ontem, e acordei esta manhã determinado a descobrir isso se isso me matasse, e estou feliz por ver uma ótima explicação já postada, agora não preciso :) :)
Rachel
1

Se eu fiz as contas direito, você tem entre 19.43%e 21.15%chance de ganhar um prêmio

O 19.43%é o melhor cenário, onde cada participante tem 6 bilhetes

O 21.15%é o pior cenário, onde cada participante tem 1 bilhete, exceto você

Ambos os cenários são extremamente improváveis, portanto, suas chances reais de ganhar provavelmente caem em algum lugar, no entanto, uma chance de aproximadamente 1/5 de ganhar parece ser um número bastante sólido de se encontrar

Os detalhes de como esses números foram obtidos podem ser encontrados nesta planilha do Google , no entanto, para resumir como eles foram obtidos:

  1. Comece com Número total de entradas (784) e Suas entradas (6)
  2. Tenha chance de ganhar ( 6 / 784 = 0.77%)
  3. Subtraia 6 para o melhor caso ou 1 para o pior caso de TotalEntries
  4. Tenha chance de ganhar ( 6/778na melhor das hipóteses, 6/783na pior das hipóteses)
  5. Repita as etapas 3 a 4 até obter 25 porcentagens
  6. Adicione as 25 porcentagens para descobrir sua chance geral de ganhar algo

Aqui está uma maneira alternativa de obter a porcentagem aproximada que é mais simples, mas não é tão precisa, pois você não remove entradas duplicadas toda vez que obtém um vencedor.

6 (your tickets) / 784 total tickets = 0.00765
0.00765 chance to win * 25 prizes = 19.14 % chance to win

EDIT: Tenho quase certeza de que estou perdendo alguma coisa na minha matemática e que você não pode simplesmente adicionar porcentagens como essa (ou multiplicar por cento de chance de ganhar por # de prêmios), embora eu ache que estou perto

O comentário de Whobar oferece 17,4% de chance de ganhar, embora eu ainda precise descobrir a fórmula que ele deu e garantir que ela seja precisa para o concurso. Talvez um projeto de fim de semana :)

Rachel
fonte
Vou apenas salientar que isso pressupõe que você tem 6 gemas.
precisa saber é o seguinte
@ murgatroid99 Sim, a questão afirmou I know how many entries I have (the maximum, 6):) eu posso fazer o editável planilha por quem quer descobrir suas chances de ganhar
Rachel
2
Eu acho que esses números estão no estádio certo em geral, mas estão em um par de por cento. É difícil dizer, já que uma descrição do cálculo que você fez não foi fornecida na própria postagem.
cardeal
1
Da sua descrição, parece que a discrepância provavelmente decorre do fato de você não ter incorporado a probabilidade de chegar à ésima etapa antes de ser escolhido. Por exemplo, no pior cenário, a probabilidade de ser selecionado no terceiro sorteio é . k(7787776)/(784783782)
cardeal
2
Rachel, oferece a chance de que uma pessoa com tickets entre tenha pelo menos um deles escolhido quando 25 desenhado. (É baseado na contagem de quantas maneiras os bilhetes de uma pessoa não puderam ser sorteados, dividindo pelo número total de sorteios possíveis e subtraindo essa proporção de ) Para o valor é 17,7%. Mas não sei se é assim que a loteria deve ser administrada. 1(n625)(n25)6n1n=784
whuber