Expectativa de um produto de variáveis ​​aleatórias dependentes quando

18

Vamos e , . Qual é a expectativa de como ?X1U[0,1]XiU[Xi1,1]i=2,3,...X1X2Xnn

usedbywho
fonte
7
Uma observação pedante: pretende significar ? Alternativamente, isso poderia significar condicionamento apenas em , ou seja, . Porém, como este último não especifica completamente a distribuição conjunta dos s, não está claro imediatamente se a expectativa é determinada exclusivamente. XiU[Xi1,1]XiX1,,Xi1U[Xi1,1]Xi1XiXi1U[Xi1,1]Xi
Juho Kokkala
Eu acho que teoricamente deveria estar condicionado em todo o anterior até . No entanto, dado , podemos obter a distribuição para . Portanto, não tenho muita certeza disso. XiXi1Xi1Xi
usar o seguinte código
@JuhoKokkala Como afirmado, não importa se você condiciona as variáveis ​​antes de porque elas não mudam o fato de ser uniforme . A distribuição de parece perfeitamente bem definida para mim. Xi1Xi[Xi1,1](X1,,Xn)
dsaxton
@dsaxton Se assumirmos apenas e , continua sendo possível que e não sejam condicionalmente independentes em . Portanto, a distribuição de não está bem definida. X1U(0,1)XiXi1U(Xi1,1),i=2,3,...X1X3X2(X1,X2,X3)
Juho Kokkala
@JuhoKokkala Se eu lhe disser que , qual é a distribuição do ? Se você pode responder à pergunta sem sequer pensar em , como e ser dependentes, dado ? Observe também como outros pôsteres não tiveram problemas ao simular essa sequência. X2=tX3X1X1X3X2
precisa saber é o seguinte

Respostas:

12

A resposta é de fato ,1/e como adivinhado nas respostas anteriores, com base em simulações e aproximações finitas.

A solução é facilmente alcançada através da introdução de uma sequência de funções . Embora possamos avançar imediatamente para essa etapa, ela pode parecer bastante misteriosa. A primeira parte desta solução explica como se pode preparar esses . A segunda parte mostra como eles são explorados para encontrar uma equação funcional satisfeita pela função limitadora . A terceira parte exibe os cálculos (de rotina) necessários para resolver esta equação funcional.f n ( t ) f ( t ) = lim n f n ( t )fn:[0,1][0,1]fn(t)f(t)=limnfn(t)


1. Motivação

Podemos chegar a isso aplicando algumas técnicas matemáticas padrão de solução de problemas. Nesse caso, onde algum tipo de operação é repetida ad infinitum, o limite existirá como um ponto fixo dessa operação. A chave, então, é identificar a operação.

A dificuldade é que a mudança de para parece complicada. É mais simples visualizar esta etapa como decorrente do adjacente às variáveis vez de adjacente às variáveis . Se considerarmos como sendo construído como descrito na pergunta - com distribuído uniformemente em , condicionalmente distribuído uniformemente em e assim por diante-- introduzindoE [ X 1 X 2X n - 1 X n ] X 1 ( X 2 , , X n ) X n ( X 1 , X 2 , , X n - 1 ) ( X 2 , , X nE[X1X2Xn1]E[X1X2Xn1Xn]X1(X2,,Xn)Xn(X1,X2,,Xn1)X 2 [ 0 , 1 ] X 3 [ X 2 , 1 ] X 1 X i 1 - X 1 1(X2,,Xn)X2[0,1]X3[X2,1]X1fará com que cada um dos subsequentes para encolher por um factor de em direcção ao limite superior . Esse raciocínio leva naturalmente à seguinte construção.Xi1X11

Como questão preliminar, como é um pouco mais simples reduzir os números para que para , deixe . Portanto, é distribuído uniformemente em e é distribuído uniformemente em condicional em para todos os Estamos interessados ​​em duas coisas:1 Y i = 1 - X i Y 1 [ 0 , 1 ] Y i + 1 [ 0 , Y i ] ( Y 1 , Y 2 , , Y i ) i = 1 , 2 , 3 , .01Yi=1XiY1[0,1]Yi+1[0,Yi](Y1,Y2,,Yi)i=1,2,3,.

  1. O valor limite de .E[X1X2Xn]=E[(1Y1)(1Y2)(1Yn)]

  2. Como esses valores se comportam ao reduzir todo o uniformemente em direção a : ou seja, escalonando todos por algum fator comum , . 0 t 0 t 1Yi0t0t1

Para esse fim, defina

fn(t)=E[(1tY1)(1tY2)(1tYn)].

Claramente cada é definido e contínuo (infinitamente diferenciável, na verdade) para todos reais . Vamos nos concentrar no comportamento deles para . t t [ 0 , 1 ]fntt[0,1]


2. O passo chave

O seguinte é óbvio:

  1. Cada é uma função monotonicamente decrescente de a .[ 0 , 1 ] [ 0 , 1 ]fn(t)[0,1][0,1]

  2. nfn(t)>fn+1(t) para todos os .n

  3. nfn(0)=1 para todos os .n

  4. E(X1X2Xn)=fn(1).

Estas implicam que existe para todos e .t [ 0 , 1 ] f ( 0 ) = 1f(t)=limnfn(t)t[0,1]f(0)=1

Observe que, condicional em , a variável é uniforme em e as variáveis (condicional em todas as variáveis ​​anteriores) são uniformes em : isto é , satisfazem precisamente as condições satisfeitas por . ConsequentementeY 2 / Y 1 [ 0 , 1 ] Y i + 1 / Y 1 [ 0 , Y i / Y 1 ] ( Y 2 / Y 1 , Y 3 / Y 1 , , Y n / Y 1 ) ( Y 1 , , Y n - 1 )Y1Y2/Y1[0,1]Yi+1/Y1[0,Yi/Y1](Y2/Y1,Y3/Y1,,Yn/Y1)(Y1,,Yn1)

fn(t)=E[(1-tY1)E[(1-tY2)(1-tYn)|Y1]]=E[(1-tY1)E[(1-tY1Y2Y1)(1-tY1YnY1)|Y1]]=E[(1-tY1)fn-1(tY1)].

Essa é a relação recursiva que estávamos procurando.

No limite de , portanto, deve ser o caso de distribuído uniformemente em independentemente de todos os ,Y [ 0 , 1 ] Y inY[0 0,1]YEu

f(t)=E[(1-tY)f(tY)]=0 01(1-ty)f(ty)dy=1t0 0t(1-x)f(x)dx.

Ou seja, deve ser um ponto fixo do para o qualLfeu

L[g](t)=1t0t(1x)g(x)dx.

3. Cálculo da solução

Limpe a fração multiplicando os dois lados por . Como o lado direito é uma integral, podemos diferenciá-lo em relação a , dandot t1/ttt

f(t)+tf(t)=(1t)f(t).

Equivalentemente, ao subtrair e dividir ambos os lados por ,tf(t)t

f(t)=f(t)

para . Podemos estender isso por continuidade para incluir . Com a condição inicial (3) , a solução exclusiva ét = 0 f ( 0 ) = 10<t1t=0f(0)=1

f(t)=et.

Consequentemente, por (4), a expectativa limitadora de é , QED. f ( 1 ) = e - 1 = 1 / eX1X2Xnf(1)=e1=1/e


Como o Mathematica parece ser uma ferramenta popular para estudar esse problema, aqui está o código do Mathematica para calcular e plotar para pequeno . O gráfico de exibe convergência rápida para (mostrado como o gráfico preto). n f 1 , f 2 , f 3 , f 4 e - tfnnf1,f2,f3,f4et

a = 0 <= t <= 1;
l[g_] := Function[{t}, (1/t) Integrate[(1 - x) g[x], {x, 0, t}, Assumptions -> a]];
f = Evaluate@Through[NestList[l, 1 - #/2 &, 3][t]]
Plot[f, {t,0,1}]

Figura

whuber
fonte
3
(+1) bela análise.
cardeal
Obrigado por compartilhar isso com a gente. Existem pessoas realmente brilhantes por aí!
Felipe Gerard
4

Atualizar

Eu acho que é uma aposta segura que a resposta seja . Corri as integrais para o valor esperado de a usando Mathematica e com eu tenhon = 2 n = 100 n = 1001/en=2n=100n=100

0.367879441171442321595523770161567628159853507344458757185018968311538556667710938369307469618599737077005261635286940285462842065735614

(até 100 casas decimais). O recíproco desse valor é

2.718281828459045235360287471351873636852026081893477137766637293458245150821149822195768231483133554

A diferença com esse recíproco ée

-7.88860905221011806482437200330334265831479532397772375613947042032873*10^-31

Eu acho que é muito próximo, ouso dizer, ser uma coincidência racional.

O código do Mathematica é o seguinte:

Do[
 x = Table[ToExpression["x" <> ToString[i]], {i, n}];
 integrand = Expand[Simplify[(x[[n - 1]]/(1 - x[[n - 1]])) Integrate[x[[n]], {x[[n]], x[[n - 1]], 1}]]];
 Do[
   integrand = Expand[Simplify[x[[i - 1]] Integrate[integrand, {x[[i]], x[[i - 1]], 1}]/(1 - x[[i - 1]])]],
   {i, n - 1, 2, -1}]
  Print[{n, N[Integrate[integrand, {x1, 0, 1}], 100]}],
 {n, 2, 100}]

Fim da atualização

Este é mais um comentário extenso do que uma resposta.

Se seguirmos uma rota de força bruta, determinando o valor esperado para vários valores de , talvez alguém reconheça um padrão e, em seguida, consiga estabelecer um limite.n

Para , temos o valor esperado do produto sendon=5

μn=01x11x21x31x41x1x2x3x4x5(1x1)(1x2)(1x3)(1x4)dx5dx4dx3dx2dx1

que é 96547/259200 ou aproximadamente 0,3724807098765432.

Se deixarmos a integral de 0 para 1, teremos um polinômio em com os seguintes resultados para a (e deixei cair o subscrito para facilitar a leitura das coisas): n = 1 n = 6x1n=1n=6

x

(x+x2)/2

(5x+5x2+2x3)/12

(28x+28x2+13x3+3x4)/72

(1631x+1631x2+791x3+231x4+36x5)/4320

(96547x+96547x2+47617x3+14997x4+3132x5+360x6)/259200

Se alguém reconhecer a forma dos coeficientes inteiros, talvez seja possível determinar um limite como (depois de executar a integração de 0 a 1 que foi removida para mostrar o polinômio subjacente).n

JimB
fonte
1/e é lindamente elegante! :)
wolfies
4

Boa pergunta. Apenas como um comentário rápido, eu observaria que:

  • Xn convergirá para 1 rapidamente; portanto, para a verificação de Monte Carlo, definir será mais do que suficiente.n=1000

  • Se , pela simulação de Monte Carlo, como , .Zn=X1X2XnnE[Zn]0.367

  • O diagrama a seguir compara o pdf de Monte Carlo simulado de com uma distribuição de Função de Potência [ie, um beta (a, 1) pdf]]Zn

f(z)=aza1

... aqui com o parâmetro :a=0.57


(fonte: tri.org.au )

Onde:

  • a curva azul indica o pdf 'empírico' de de Monte CarloZn
  • a curva tracejada vermelha é um pdf do PowerFunction.

O ajuste parece muito bom.

Código

Aqui estão 1 milhão de desenhos pseudo-aleatórios do produto (digamos, com ), aqui usando o Mathematica :Znn=1000

data = Table[Times @@ NestList[RandomReal[{#, 1}] &, RandomReal[], 1000], {10^6}];

A média da amostra é:

 Mean[data]

0,367657

wolfies
fonte
você pode compartilhar todo o seu código? Minha solução difere da sua.
1
O primeiro ponto, que é crucial, não parece ser suficientemente bem justificado. Por que você pode descartar o efeito, digamos, dos próximos valores de ? Apesar da convergência "rápida", seu efeito cumulativo pode diminuir consideravelmente a expectativa. 10100xn
whuber
1
Bom uso da simulação aqui. Tenho perguntas semelhantes às @whuber. Como podemos ter certeza de que o valor converge para 0,367, mas não para algo menor, o que é potencialmente possível se for maior? n
usar o seguinte código
Em resposta aos 2 comentários acima: (a) A série converge muito rapidamente para 1. Mesmo começando com um valor inicial de , em cerca de 60 iterações, será numericamente indistinguível do numérico 1.0 para um computador . Portanto, simular com é um exagero. (b) Como parte do teste de Monte Carlo, também verifiquei a mesma simulação (com 1 milhão de execuções), mas usando vez de 1000, e os resultados foram indistinguíveis. Portanto, parece improvável que valores maiores de façam qualquer diferença discernível: acima de , é efetivamente 1,0.XiX1=0.1X60Xnn=1000n=5000nn=100Xn
wolfies
0

Puramente intuitivamente, e com base na outra resposta de Rusty, acho que a resposta deve ser algo assim:

n = 1:1000
x = (1 + (n^2 - 1)/(n^2)) / 2
prod(x)

O que nos dá 0.3583668. Para cada , você está dividindo o intervalo ao meio, onde começa em . Portanto, é um produto de , etc.X(a,1)a01/2,(1+3/4)/2,(1+8/9)/2

Isso é apenas intuição.


O problema com a resposta de Rusty é que U [1] é idêntico em todas as simulações. As simulações não são independentes. Uma correção para isso é fácil. Mova a linha com U[1] = runif(1,0,1)para dentro do primeiro loop. O resultado é:

set.seed(3)    #Just for reproducibility of my solution

n = 1000    #Number of random variables
S = 1000    #Number of Monte Carlo samples

Z = rep(NA,S)
U = rep(NA,n)

for(j in 1:S){
    U[1] = runif(1,0,1)
    for(i in 2:n){
        U[i] = runif(1,U[i-1],1)
    }
    Z[j] = prod(U)
}

mean(Z)

Isso dá 0.3545284.

Jessica
fonte
1
Correção muito simples! Eu acho que é verdade, sempre há um bug no código! Vou anotar minha resposta.
1
Sim, era exatamente o que eu esperava que acontecesse, uma vez que você conecta os valores esperados como limites inferiores.
1
S=100000.3631297