Nós rolamos um dado de 6 lados um grande número de vezes.
Calculando a diferença (valor absoluto) entre um rolo e o rolo anterior, espera-se que as diferenças sejam distribuídas uniformemente?
Para ilustrar com 10 rolos:
roll num result diff
1 1 0
2 2 1
3 1 1
4 3 2
5 3 0
6 5 2
7 1 4
8 6 5
9 4 2
10 4 0
Os diff
valores seriam distribuídos uniformemente?
distributions
uniform
HeyJude
fonte
fonte
Respostas:
Não, não é uniforme
Você pode contar as possibilidades igualmente prováveis para as diferenças absolutas36
que fornece uma distribuição de probabilidade para as diferenças absolutas de
fonte
Usando apenas os axiomas mais básicos sobre probabilidades e números reais, pode-se provar uma afirmação muito mais forte:
(Uma declaração análoga para variáveis contínuas é comprovada no PDF uniforme da diferença de dois rv .)
A idéia é que a chance deX−Y ser um valor extremo deve ser menor do que a chance de X−Y ser zero, porque há apenas uma maneira de (por exemplo) maximizar X−Y enquanto existem muitas maneiras de fazer a diferença zero. , porque X e Y têm a mesma distribuição e, portanto, podem ser iguais. Aqui estão os detalhes.
Primeiro, observe que as duas variáveis hipotéticasX e Y em questão podem atingir apenas um número finito n de valores com probabilidade positiva, porque haverá pelo menos n diferenças distintas e uma distribuição uniforme atribui todas as mesmas probabilidades. Se n é infinito, então seria o número de possíveis diferenças com probabilidade igual e positiva, de onde a soma de suas chances seria infinita, o que é impossível.
Por último , porque e têm a mesma distribuição, há muitas maneiras as suas diferenças podem produzir o valor Entre estas formas são os casos em que e Como essa distribuição é inconstante, difere de Isso mostra que esses dois casos são eventos disjuntos e, portanto, devem contribuir com pelo menos uma quantidade para a chance de ser zero; isso é,X Y 0. X=Y=m X=Y=M. m M. p 2 + q 2 X - Yp2+q2 X−Y
Como os quadrados dos números não são negativos, onde deduzimos de que0≤(p−q)2, (∗)
mostrando a distribuição de não é uniforme, QED.X−Y
Editar em resposta a um comentário
Uma análise semelhante das diferenças absolutasobserva que, porque e têm a mesma distribuição,Isso exige que estudemosA mesma técnica algébrica produz quase o mesmo resultado, mas existe a possibilidade de eEsse sistema de equações tem a solução única|X−Y| X Y m=−M. Pr(X−Y=|M−m|)=2pq. 2pq=2pq+(p−q)2 2pq+p2+q2=1. p=q=1/2 correspondente a uma moeda justa (um "dado de duas faces"). Para além desta exceção, o resultado para as diferenças absolutas é o mesmo que para as diferenças e pelas mesmas razões subjacentes já indicadas: a saber, as diferenças absolutas de duas variáveis aleatórias iid não podem ser distribuídas uniformemente sempre que houver mais de duas diferenças distintas com probabilidade positiva.
(fim da edição)
Vamos aplicar esse resultado à pergunta, que pergunta sobre algo um pouco mais complexo.
Modele cada rolagem independente do dado (que pode ser um dado injusto ) com uma variável aleatória As diferenças observadas nesses rolos são os números Podemos nos perguntar como esses números são distribuídos uniformemente . Essa é realmente uma pergunta sobre as expectativas estatísticas: qual é o número esperado de iguais a zero, por exemplo? Qual é o número esperado de igual a ? Etc etc.Xi, i=1,2,…,n. n ΔXi=Xi+1−Xi. n−1 ΔXi ΔXi −1
O aspecto problemático dessa pergunta é que o não é independente: por exemplo, e envolvem o mesmo roloΔXi ΔX1=X2−X1 ΔX2=X3−X2 X2.
No entanto, isso não é realmente uma dificuldade. Como a expectativa estatística é aditiva e todas as diferenças têm a mesma distribuição, se escolhermos qualquer valor possível das diferenças, o número esperado de vezes que a diferença é igual a em toda a sequência de rolos é vezes o número esperado de vezes a diferença é igual a em uma única etapa do processo. Essa expectativa de etapa única é (para qualquer ). Essas expectativas serão as mesmas para todos os (ou seja, uniformes ) se e somente se forem iguais para um únicok k n n−1 k Pr(ΔXi=k) i k ΔXi. Mas vimos que nenhum tem uma distribuição uniforme, mesmo quando o dado pode ser tendencioso. Assim, mesmo nesse sentido mais fraco de frequências esperadas, as diferenças dos testes não são uniformes.ΔXi
fonte
Em um nível intuitivo, um evento aleatório só pode ser distribuído uniformemente se todos os seus resultados forem igualmente prováveis.
Isso é verdade para o evento aleatório em questão - diferença absoluta entre dois lançamentos de dados?
Neste caso, basta olhar para os extremos - quais são os maiores e menores valores que essa diferença pode levar?
Obviamente, 0 é o menor (estamos vendo diferenças absolutas e as jogadas podem ser as mesmas) e 5 é o maior (
6
vs1
).Podemos mostrar que o evento não é uniforme, mostrando que
0
é mais (ou menos) provável que ocorra do que5
.À primeira vista, existem apenas duas maneiras de ocorrer 5 - se o primeiro dado for 6 e o segundo 1, ou vice-versa . Quantas maneiras 0 podem ocorrer?
fonte
Conforme apresentado por Henry, diferenças de distribuições uniformemente distribuídas não são uniformemente distribuídas.
Para ilustrar isso com dados simulados, podemos usar um script R muito simples:
Vemos que isso produz de fato uma distribuição uniforme. Vamos agora dar uma olhada na distribuição das diferenças absolutas de duas amostras aleatórias dessa distribuição.
fonte
Outros já trabalharam nos cálculos, eu darei uma resposta que me parece mais intuitiva. Você deseja estudar a soma de dois unifrom rv (Z = X + (-Y)), a distribuição geral é o produto de convolução (discreto):
Essa soma é bastante intuitiva: a probabilidade de obter é a soma das probabilidades de obter algo com X (observado aqui) e o complemento de com -Y.z k z
Do processamento do sinal, sabemos como o produto de convolução se comporta:
Você pode entender o que acontece aqui: à medida que move para cima (a linha pontilhada vertical), o domínio comum de ambos os retângulos se move para cima e para baixo, o que corresponde à probabilidade de obter .z z
Em geral, sabemos que as únicas funções que são estáveis por convolução são as da família gaussiana. ou seja, apenas a distribuição gaussiana é estável por adição (ou mais geralmente, combinação linear). Isso também significa que você não recebe uma distribuição uniforme ao combinar distribuições uniformes.
Quanto ao motivo pelo qual obtemos esses resultados, a resposta está na decomposição de Fourrier dessas funções. A transformação de Fourrier de um produto de convolução é o produto simples das transformações de Fourrier de cada função. Isso fornece links diretos entre os coeficientes de quatro camadas das funções retângulo e triângulo.
fonte
Se e são duas jogadas de dados consecutivos, você pode visualizar (para ), conforme a seguir, onde cada cor corresponde a um valor diferente de :x y |x−y|=k k=0,1,2,3,4,5 k
Como você pode ver facilmente, o número de pontos para cada cor não é o mesmo; portanto, as diferenças não são distribuídas uniformemente.
fonte
Seja denotado a diferença e o valor do rolo, entãoDt X P(Dt=5)=P(Xt=6,Xt−1=1)<P((Xt,Xt−1)∈{(6,3),(5,2)})<P(Dt=3)
Portanto, a função não é constante em . Isso significa que a distribuição não é uniforme.P(Dt=d) d
fonte