No Libre Office Calc, a rand()
função está disponível, que escolhe um valor aleatório entre 0 e 1 de uma distribuição uniforme. Estou um pouco enferrujado com a minha probabilidade, então, quando vi o seguinte comportamento, fiquei perplexo:
A
= Coluna 200x1 de rand()^2
B
= Coluna 200x1 de rand()*rand()
mean(A)
= 1/3
mean(B)
= 1/4
Por que é mean(A)
! = 1/4
?
expected-value
random-generation
uniform
Jefftopia
fonte
fonte
rand()
opera como outros operadores semelhantes, A é o mesmo número aleatório ao quadrado e B é dois números aleatórios, multiplicados.Rand()
foram substituídos porInt(2*Rand())
: assume os valores e com probabilidades iguais. Existem duas possibilidades para seu quadrado e quatro possibilidades para o produto de dois valores (independentes): o que acontece quando você calcula as expectativas deles?Respostas:
Pode ser útil pensar em retângulos. Imagine que você tem a chance de obter terras de graça. O tamanho da terra será determinado por (a) uma realização da variável aleatória ou (b) duas realizações da mesma variável aleatória. No primeiro caso (a), a área será um quadrado com o comprimento lateral igual ao valor amostrado. No segundo caso (b), os dois valores amostrados representarão a largura e o comprimento de um retângulo. Qual alternativa você escolhe?
Seja a realização de uma variável aleatória positiva.U
a) O valor esperado de uma realização determina a área do quadrado que é igual a U 2 . Em média, o tamanho da área será E [ U 2 ]U U2
b) Se houver duas realizações independentes e U 2 , a área será U 1 ⋅ U 2 . Em média, o tamanho é igual a E [ L 1 ⋅ L 2 ] = E 2 [ L ] uma vez que ambas as realizações são da mesma distribuição e independente.U1 U2 U1⋅U2
Quando calculamos a diferença entre o tamanho das áreas a) eb), obtemos
O termo acima é idêntico a que é inerentemente maior ou igual a 0 .V a r[ U ] 0 0
Isso vale para o caso geral.
No seu exemplo, você fez uma amostra da distribuição uniforme . Conseqüentemente,você( 0 , 1 )
E2[U]=1
Esses valores foram derivados analiticamente, mas correspondem aos que você obteve com o gerador de números aleatórios.
fonte
Para não sugerir que haja algo faltando na excelente resposta de Sven, mas eu queria apresentar uma abordagem relativamente elementar à pergunta.
Considere plotar os dois componentes de cada produto para verificar se a distribuição conjunta é muito diferente.
Observe que o produto tende a ser grande (quase 1) quando os dois componentes são grandes, o que acontece com muito mais facilidade quando os dois componentes estão perfeitamente correlacionados, em vez de independentes.
Quanta diferença!
Pode ser útil desenhar contornos de produtos iso em gráficos como os acima - ou seja, curvas em que xy = constante para valores como 0,5, 0,6, 0,7, 0,8, 0,9. À medida que você vai para valores cada vez maiores, a proporção de pontos acima e à direita do contorno diminui muito mais rapidamente no caso independente.
fonte