Por que o número de variáveis ​​uniformes contínuas em (0,1) necessárias para que sua soma exceda um tem a média

14

Vamos resumir um fluxo de variáveis aleatórias, XiiidU(0,1) ; seja Y o número de termos que precisamos para que o total exceda um, ou seja, Y é o menor número que

X1+X2++XY>1.

Por que a média de Y igual a constante de Euler e ?

E(Y)=e=10!+11!+12!+13!+
Silverfish
fonte
Estou postando isso no espírito de uma pergunta de auto-estudo, embora eu ache que a vi pela primeira vez há mais de uma década. Não me lembro como respondi na época, embora tenha certeza de que não foi assim que vi quando vi essa propriedade mencionada no tópico Approximate e using Monte Carlo Simulation . Como suspeito que essa seja uma pergunta de exercício bastante comum, optei por apresentar um esboço em vez de uma solução completa, embora suponha que o principal "aviso de spoiler" pertença à própria pergunta!
Silverfish
Continuo muito interessado em abordagens alternativas; Eu sei que isso foi incluído como uma questão na Teoria da Probabilidade de Gnedenko (originalmente em russo, mas amplamente traduzida), mas não sei qual solução era esperada lá ou colocada em outro lugar.
Silverfish
1
Eu escrevi uma solução de simulação no MATLAB usando seu método simplex. Eu não sabia sobre o link para simplexes, é tão inesperado.
Aksakal

Respostas:

14

Primeira observação: tem um CDF mais agradável que o PMFY

A função de densidade de probabilidade é a probabilidade de que n é "apenas o suficiente" para o total a exceder unidade, isto é, X 1 + X 2 + ... X n excede uma enquanto X 1 + + X n - 1 faz não.pY(n)nX1+X2+XnX1++Xn1

A distribuição cumulativa requer simplesmente n é "suficiente", ou seja, Σ n i = 1 X i > 1 , sem restrição de como muito perto. Parece um evento muito mais simples de lidar com a probabilidade de.FY(n)=Pr(Yn)ni=1nXi>1

Segunda observação: recebe valores inteiros não negativos, para que E ( Y ) possa ser escrito em termos de CDFYE(Y)

Claramente só pode assumir valores em { 0 , 1 , 2 , ... } , para que possamos escrever sua média em termos da CDF complementar , ˉ F Y .Y{0,1,2,}F¯Y

E(Y)=n=0F¯Y(n)=n=0(1FY(n))

De fato, e Pr ( Y = 1 ) são zero, então os dois primeiros termos são E ( Y ) = 1 + 1 + .Pr(Y=0)Pr(Y=1)E(Y)=1+1+

Quanto aos termos posteriores, se é a probabilidade de n i = 1 X i > 1 , qual evento é ˉ F Y ( n ) a probabilidade de?FY(n)i=1nXi>1F¯Y(n)

Terceira observação: o (hiper) volume de um simplex é 1n1n!

O -simplex eu ter em mente ocupa o volume debaixo de uma unidade padrão ( n - 1 ) -simplex no todo-positivo orthant de R n : é o casco convexo de ( n + 1 ) vértices, em particular, a origem mais os vértices da unidade ( n - 1 ) -simplex em ( 1 , 0 , 0 , ) , ( 0 , 1 , 0 , n(n1)Rn(n+1)(n1)(1,0,0,) etc.(0,1,0,)

volumes de 2-simplex e 3-simplex

Por exemplo, o 2-simplex acima com tem a área 1x1+x21 e o 3-simplex comx1+x2+x31tem o volume112x1+x2+x31 .16

Para uma prova que prossegue avaliando diretamente uma integral para a probabilidade do evento descrito por e vincula-se a dois outros argumentos, consulte este tópico do Math SE . O fio afins também podem ser de interesse: Existe uma relação entre e e a soma de n -simplexes volumes?F¯Y(n)en

Silverfish
fonte
1
Essa é uma abordagem geométrica interessante e fácil de resolver dessa maneira. Lindo. Aqui está a equação para um volume de um simplex. Eu não acho que poderia haver uma solução mais elegante, francamente
Aksakal
1
+1 Você também pode obter a distribuição completa de de qualquer uma das abordagens na minha publicação em stats.stackexchange.com/questions/41467/… . Y
whuber
Se me deparei com esta solução, não há nenhuma maneira que poderia forçar-me fazê-lo outra maneira em uma escola :)
Aksakal
11

Corrija . Seja U i = X 1 + X 2 + + X in1 são as partes fracionárias das somas parciais para i = 1 , 2 , , n . A uniformidade independente de X 1 e X i + 1 garante que U i + 1 tem a probabilidade de exceder U i tanto quanto menor que ele. Isso implica quetodos os n ! ordenações da sequência ( U i ) são igualmente prováveis.

Ui=X1+X2++Ximod1
i=1,2,,nX1Xi+1Ui+1Uin!(Ui)

Dada a sequência , podemos recuperar a sequência X 1 , X 2 , , X n . Para ver como, observe queU1,U2,,UnX1,X2,,Xn

  • porque ambos estão entre 0 e 1 .U1=X101

  • Se , então X i + 1 = U i + 1 - U i .Ui+1UiXi+1=Ui+1Ui

  • Caso contrário, , de onde X i + 1 = U i + 1 - U i + 1 .Ui+Xi+1>1Xi+1=Ui+1Ui+1

Existe exactamente uma sequência em que o já estão em ordem crescente, no caso em que um > L n = X 1 + X 2 + + X n . Sendo um dos n ! Seqüências igualmente prováveis, isso tem uma chance 1 / n ! de ocorrer. Em todas as outras seqüências, pelo menos um passo de U i a U i + 1 está fora de ordem. Isso implica que a soma do X que eu tinha que ser igual ou superior a 1Ui1>Un=X1+X2++Xnn!1/n!UiUi+1Xi1. Assim, vemos que

Pr(Y>n)=Pr(X1+X2++Xn1)=Pr(X1+X2++Xn<1)=1n!.

Isso gera as probabilidades para toda a distribuição de , pois para a integral n 1Yn1

Pr(Y=n)=Pr(Y>n1)Pr(Y>n)=1(n1)!1n!=n1n!.

Além disso,

E(Y)=n=0Pr(Y>n)=n=01n!=e,

QED.

whuber
fonte
I have read it a couple of times, and I almost get it... I posted a couple of questions in the Mathematics SE as a result of the e constant computer simulation. I don't know if you saw them. One of them came back before your kind explanation on Tenfold about the ceiling function of the 1/U(0,1) and the Taylor series. The second one was exactly about this topic, never got a response, until now...
Antoni Parellada
here and here.
Antoni Parellada
And could you add the proof with the uniform spacings as well?
Xi'an
@Xi'an Could you indicate more specifically what you mean by "uniform spacings" in this context?
whuber
I am referring to your Poisson process simulation via the uniform spacing, in the thread Approximate e using Monte Carlo Simulation for which I cannot get a full derivation.
Xi'an
6

In Sheldon Ross' A First Course in Probability there is an easy to follow proof:

UiiidU(0,1)YU1+U2++UY>1

Y=min{n:i=1nUi>1}

If instead we looked for:

Y(u)=min{n:i=1nUi>u}
for u[0,1], we define the f(u)=E[Y(u)], expressing the expectation for the number of realizations of uniform draws that will exceed u when added.

We can apply the following general properties for continuous variables:

E[X]=E[E[X|Y]]=E[X|Y=y]fY(y)dy

to express f(u) conditionally on the outcome of the first uniform, and getting a manageable equation thanks to the pdf of XU(0,1), fY(y)=1. This would be it:

(1)f(u)=01E[Y(u)|U1=x]dx

If the U1=x we are conditioning on is greater than u, i.e. x>u, E[Y(u)|U1=x]=1. If, on the other hand, x<u, E[Y(u)|U1=x]=1+f(ux), because we already have drawn 1 uniform random, and we still have the difference between x and u to cover. Going back to equation (1):

f(u)=1+0xf(ux)dx
, and with substituting w=ux we would have f(u)=1+0xf(w)dw.

If we differentiate both sides of this equation, we can see that:

f(u)=f(u)f(u)f(u)=1

with one last integration we get:

log[f(u)]=u+cf(u)=keu

We know that the expectation that drawing a sample from the uniform distribution and surpassing 0 is 1, or f(0)=1. Hence, k=1, and f(u)=eu. Therefore f(1)=e.

Antoni Parellada
fonte
I do like the manner in which this generalises the result.
Silverfish