Por que a distribuição de rand () ^ 2 é diferente de rand () * rand ()?

14

No Libre Office Calc, a rand()função está disponível, que escolhe um valor aleatório entre 0 e 1 de uma distribuição uniforme. Estou um pouco enferrujado com a minha probabilidade, então, quando vi o seguinte comportamento, fiquei perplexo:

A = Coluna 200x1 de rand()^2

B = Coluna 200x1 de rand()*rand()

mean(A) = 1/3

mean(B) = 1/4

Por que é mean(A)! = 1/4?

Jefftopia
fonte
3
Porque a expectativa do quadrado de uma variável aleatória não é igual ao quadrado da sua expectativa.
Michael M
3
Se rand()opera como outros operadores semelhantes, A é o mesmo número aleatório ao quadrado e B é dois números aleatórios, multiplicados.
Peter Flom - Restabelece Monica
Compreendo. Seria muito útil, se eu pudesse ver a matemática explicitada, ou vinculada a um recurso que faz isso.
101313 Jefftopia
4
Simplificar a situação pode ajudá-lo a entender o ponto. Suponha que Rand()foram substituídos por Int(2*Rand()): assume os valores e com probabilidades iguais. Existem duas possibilidades para seu quadrado e quatro possibilidades para o produto de dois valores (independentes): o que acontece quando você calcula as expectativas deles? 01
whuber

Respostas:

24

Pode ser útil pensar em retângulos. Imagine que você tem a chance de obter terras de graça. O tamanho da terra será determinado por (a) uma realização da variável aleatória ou (b) duas realizações da mesma variável aleatória. No primeiro caso (a), a área será um quadrado com o comprimento lateral igual ao valor amostrado. No segundo caso (b), os dois valores amostrados representarão a largura e o comprimento de um retângulo. Qual alternativa você escolhe?

Seja a realização de uma variável aleatória positiva.U

a) O valor esperado de uma realização determina a área do quadrado que é igual a U 2 . Em média, o tamanho da área será E [ U 2 ]UU2

E[U2]

b) Se houver duas realizações independentes e U 2 , a área será U 1U 2 . Em média, o tamanho é igual a E [ L 1L 2 ] = E 2 [ L ] uma vez que ambas as realizações são da mesma distribuição e independente.U1U2U1U2

E[U1U2]=E2[U]

Quando calculamos a diferença entre o tamanho das áreas a) eb), obtemos

E[você2]-E2[você]

O termo acima é idêntico a que é inerentemente maior ou igual a 0 .Vumar[você]0 0

Isso vale para o caso geral.

No seu exemplo, você fez uma amostra da distribuição uniforme . Conseqüentemente,você(0 0,1)

E2[U]=1

E[você]=12
Var[U]=1
E2[você]=14
Vumar[você]=112

E[você2]=Vumar[você]+E2[você]

E[você2]=112+14=13

Esses valores foram derivados analiticamente, mas correspondem aos que você obteve com o gerador de números aleatórios.

Sven Hohenstein
fonte
umabuma2+umab+b23
Esse é um uso inteligente da variação. E aqui eu estava prestes a fazer a matemática diretamente.
Afine
Isso faz sentido para mim. Tudo depende da variação não ser negativa. Também estou curioso para saber como John conseguiu sua resposta.
Jefftopia
Basicamente, apenas seguimos o que Sven fez, mas as substituiu pelas fórmulas para uma distribuição uniforme mais geral.
John
E[você2]-E[você2]E[você2]-E2[você]
9

Para não sugerir que haja algo faltando na excelente resposta de Sven, mas eu queria apresentar uma abordagem relativamente elementar à pergunta.

Considere plotar os dois componentes de cada produto para verificar se a distribuição conjunta é muito diferente.

enredo de u1 vs u2 e u1 vs u1

Observe que o produto tende a ser grande (quase 1) quando os dois componentes são grandes, o que acontece com muito mais facilidade quando os dois componentes estão perfeitamente correlacionados, em vez de independentes.

1-ϵϵϵ/2você2você1×você2ϵ2/2

Quanta diferença!

Pode ser útil desenhar contornos de produtos iso em gráficos como os acima - ou seja, curvas em que xy = constante para valores como 0,5, 0,6, 0,7, 0,8, 0,9. À medida que você vai para valores cada vez maiores, a proporção de pontos acima e à direita do contorno diminui muito mais rapidamente no caso independente.

Glen_b -Reinstate Monica
fonte