Quantas vezes devo rolar um dado para avaliar com segurança sua justiça?

22

(Pedimos desculpas antecipadamente pelo uso da linguagem leiga e não da estatística).

Se eu quiser medir as chances de rolar cada lado de uma matriz física específica de seis lados para cerca de +/- 2% com uma confiança razoável de certeza, quantos rolos de matriz de amostra seriam necessários?

ou seja, quantas vezes eu precisaria rolar um dado, contando cada resultado, para ter 98% de certeza de que as chances de rolar cada lado estão entre 14,6% e 18,7%? (Ou alguns critérios semelhantes, nos quais seria de cerca de 98% de certeza de que o dado é justo dentro de 2%.)

(Esta é uma preocupação do mundo real para jogos de simulação que usam dados e quer ter certeza de que certos desenhos de dados têm uma probabilidade aceitável de 1/6 de rolar cada número. Há alegações de que muitos desenhos de dados comuns foram medidos rolando 29% 1s por rolando vários dados 1000 vezes cada.)

Dronz
fonte
1
Isso é muito mais complicado do que encontrar o intervalo de confiança para um binômio, pois você deseja manter todas as probabilidades sob controle. Dê uma olhada no papel de Hsiuying Wang em intervalos de confiança simultâneos para distribuição multinomial ( Journal of Análise Multivariada 2008, 99, 5, 896-911). Você pode encontrar algum código nesta postagem do blog , que também fornece um resumo rápido de alguns dos trabalhos realizados.
Idnavid 9/10/19
1
Observe que, se você está apenas interessado em verificar se os 1's são rolados uma quantidade razoável de tempo, isso simplifica bastante a pergunta.
Dennis Jaheruddin
2
É importante observar que o "intervalo de confiança" não oferece uma "probabilidade percentual de estar correto". Eu suspeito que você esteja usando o uso comum bastante razoável do termo "98% de certeza", mas você deve saber sempre que alguém mencionar "intervalo de confiança" que não seja o mesmo que uma probabilidade de 98%: link.springer.com/ Artigo / 10.3758% 2Fs13423-013-0572-3
BrianH 09/10
1
@BrianH Obrigado! Não quis dizer apenas a expressão coloquial, mas estou procurando quantificar a certeza implícita no teste. Parece-me que, da mesma forma que faz sentido dizer que espero lançar algum resultado do dado em uma porcentagem calculável do tempo, haveria um cálculo semelhante (mas mais complexo) para a probabilidade de apresentar resultados dentro uma certa margem de erro no roll n vezes, que é o que acho que entendo a resposta de Xiamoi (e o comentário de acompanhamento) está dizendo. Sim?
Dronz 9/10/19
1
@Dronz Para ser justo, essa é uma daquelas coisas que você realmente acha que seria mais direta do que realmente é. Diabolicamente complicado, na verdade. Aqui estão algumas perguntas relacionadas chave em outra parte para ajudar a dar-lhe uma idéia de como não há incrivelmente resposta simples e direta: freqüentista math.stackexchange.com/questions/1578932/... Bayesian math.stackexchange.com/questions/1584833/... e divertido: rpg.stackexchange.com/questions/70802/...
BrianH

Respostas:

18

TL; DR: se p = 1/6 e você deseja saber qual o tamanho n precisa ter 98% de certeza de que os dados são justos (entre 2%), n precisa ter pelo menos n ≥ 766 .


Seja n o número de jogadas e X o número de jogadas que caem em algum lado especificado. Então X segue uma distribuição binomial (n, p) onde p é a probabilidade de obter esse lado especificado.

Pelo teorema do limite central, sabemos que

n(X/np)N(0,p(1p))

Como X/n é a média amostral de n variáveis ​​aleatórias de Bernoulli (p) . Portanto, para n grande , os intervalos de confiança para p podem ser construídos como

Xn±Zp(1p)n

Desde p é desconhecida, podemos substituí-lo com a média da amostra p = X / n , e por vários teoremas de convergência, sabemos que o intervalo de confiança resultante será assintoticamente válido. Portanto, obtemos intervalos de confiança do formuláriop^=X/n

p^±Zp^(1p^)n

with p^=X/n. I'm going to assume you know what Z-scores are. For example, if you want a 95% confidence interval, you take Z=1.96. So for a given confidence level α we have

p^±Zαp^(1p^)n

Now let's say you want this confidence interval to be of length less than Cα, and want to know how big a sample we need to make this case. Well this is equivelant to asking what nα satisfies

Zαp^(1p^)nαCα2

Which is then solved to obtain

nα(2ZαCα)2p^(1p^)

So plug in your values for Zα, Cα, and estimated p^ to obtain an estimate for nα. Note that since p is unknown this is only an estimate, but asymptotically (as n gets larger) it should be accurate.

Xiaomi
fonte
3
Thanks. As I have not done college-type math in decades, could I trouble you to plug in the numbers and actually give me a ballpark number of times I'd need to roll a die, as an integer?
Dronz
9
if p=1/6 and you want to know how large n needs to be 98% sure the dice is fair to within 2%, n needs to be at least n766. Ignore my last comment, used incorrect Cα.
Xiaomi
4
It might be more interesting to look at the multinomial distribution, since now we test for each side separately. This does not take into account all the information we have on the problem. For an intiuitive explanation look at stat.berkeley.edu/~stark/SticiGui/Text/chiSquare.htm
Jan
5
I agree with @Jan: This answer does not address the question. Moreover, it cannot easily be adapted to construct an answer by applying it separately to all six faces, because the six tests are interdependent.
whuber
3
This is a nice answer, but I fully agree with @Jan, whuber. This question deserves an answer based on chi-square statistic and multinomial distribution.
Łukasz Grad