Como posso testar a justiça de um dado de vinte lados (d20)? Obviamente, eu compararia a distribuição de valores com uma distribuição uniforme. Lembro-me vagamente de usar um teste de qui-quadrado na faculdade. Como posso aplicar isso para ver se um dado é justo?
29
Respostas:
Aqui está um exemplo com código R. A saída é precedida por # 's. Um dado justo:
Um dado tendencioso - os números 1 a 10 têm uma probabilidade de 0,045; aqueles 11-20 têm uma probabilidade de 0,055 - 200 arremessos:
Temos evidências insuficientes de viés (p = 0,64).
Um dado tendencioso, 1000 joga:
Agora p <0,05 e estamos começando a ver evidências de viés. Você pode usar simulações semelhantes para estimar o nível de viés que você espera detectar e o número de jogadas necessárias para detectá-lo com um determinado nível p.
Uau, outras 2 respostas antes mesmo de terminar de digitar.
fonte
Deseja fazê-lo manualmente ou em excel?
Se você deseja fazer isso em R , pode fazê-lo desta maneira:
Etapa 1: jogue seu dado (digamos) 100 vezes.
Etapa 2: conte quantas vezes você obteve cada um dos seus números
Etapa 3: coloque-os em R desta maneira (escreva o número de vezes que cada dado que você obteve, em vez dos números que escrevi):
Etapa 4: basta executar este comando:
Se o valor de P for baixo (por exemplo, abaixo de 0,05) - seu dado não será equilibrado.
Este comando simula um dado balanceado (P = ~ .5):
E isso simula um dado desequilibrado:
(É sobre P = ~ 0,005)
Agora, a verdadeira questão é quantos dados devem ser rolados para que nível de poder de detecção. Se alguém quer resolver isso, é bem-vindo ...
Atualização: Há também um bom artigo sobre este tópico aqui .
fonte
Primeiro, de acordo com o que Glen_b disse, um bayesiano não está realmente interessado em saber se o dado é exatamente justo - não é. O que importa é se está próximo o suficiente , o que quer que "suficiente" signifique no contexto, digamos, dentro de 5% do justo para cada lado.
Enfim, aqui está como (com R):
Primeiro, obtenha alguns dados. Nós rolamos o dado 500 vezes.
(estamos começando com um dado justo; na prática, esses dados serão observados.)
Finalmente, vamos estimar nossa probabilidade posterior (depois de observar os dados) de que o dado esteja dentro de 0,05 da média em cada coordenada.
O resultado é de cerca de 0,9486 na minha máquina. (Não é realmente uma surpresa. Afinal, começamos com um dado justo.)
Observação rápida: provavelmente não é razoável termos utilizado um artigo não informativo antes neste exemplo. Como existe uma dúvida, presumivelmente, o dado parece aproximadamente equilibrado em primeiro lugar, portanto, é melhor escolher um prior que esteja concentrado mais próximo de 1/3 em todas as coordenadas. Acima disso, simplesmente aumentaria nossa probabilidade posterior estimada de "próximo ao justo".
fonte
Um teste qui-quadrado de qualidade de ajuste visa encontrar todos os tipos possíveis de desvios da uniformidade estrita. Isso é razoável com um d4 ou um d6, mas com um d20, você provavelmente está mais interessado em verificar se a probabilidade de rolar sob (ou possivelmente exceder) cada resultado está próxima do que deveria ser.
O que estou entendendo é que existem alguns tipos de desvios da justiça que impactarão fortemente o que você estiver usando para um d20 e outros tipos de desvios que pouco importam, e o teste do qui-quadrado dividirá o poder entre os mais interessantes. e alternativas menos interessantes. A conseqüência é que, para ter poder suficiente para captar desvios razoavelmente moderados da justiça, você precisa de um grande número de testes - muito mais do que você gostaria de sentar e gerar.
(Dica: crie alguns conjuntos de probabilidades não uniformes para o seu d20 que afetarão mais o resultado para o qual você está usando o d20 e use testes de simulação e qui-quadrado para descobrir que poder você tem contra eles vários números de rolos, para que você tenha uma idéia do número de rolos que precisará.)
Existem várias maneiras de verificar desvios "interessantes" (aqueles que provavelmente afetarão substancialmente os usos típicos de um d20)
Minha recomendação é fazer um teste ECDF (teste do tipo Kolmogorov-Smirnov / Anderson-Darling - mas você provavelmente desejará ajustar a conservatividade resultante da distribuição ser discreta - pelo menos, elevando o nível alfa nominal, mas até melhor apenas simulando a distribuição para ver como a distribuição da estatística de teste vale para um d20).
Eles ainda podem captar qualquer tipo de desvio, mas dão um peso relativamente maior aos tipos mais importantes de desvio.
Uma abordagem ainda mais poderosa é construir especificamente uma estatística de teste que seja especificamente sensível às alternativas mais importantes para você, mas envolve um pouco mais de trabalho.
Em esta resposta que sugerem um método gráfico para testar uma matriz com base no tamanho dos desvios individuais. Como no teste do qui-quadrado, isso faz mais sentido para dados com poucos lados, como d4 ou d6.
fonte
Se você estiver interessado em apenas verificar o número de vezes que cada número aparece, um teste qui-quadrado seria adequado. Suponha que você jogue um dado N vezes. Você esperaria que cada valor aumentasse N / 20 vezes. Tudo o que um teste qui-quadrado faz é comparar o que você observou com o que obtém. Se essa diferença for muito grande, isso indicaria um problema.
Outros testes
Se você estava interessado em outros aspectos da negligência, por exemplo, se você deu os seguintes dados:
Então, embora essa saída tenha o número correto de cada valor individual, claramente não é aleatória. Nesse caso, dê uma olhada nesta pergunta . Provavelmente isso só faz sentido para dados eletrônicos.
Teste qui-quadrado em R
Em R, isso seria
fonte
Talvez não deva se concentrar tanto em um conjunto de rolos.
Tente rolar um dado de 6 lados 10 vezes e repita o processo 8 vezes.
Você pode verificar se a soma de cada repetição é 10.
Para cada repetição (coluna), você pode calcular a qualidade do ajuste usando o teste Chi ^ 2.
Quanto mais lances você fizer, menos tendencioso verá. Vamos fazer isso por um grande número.
fonte