Quebra-cabeças: Qual é o comprimento esperado de uma sequência iid que aumenta monotonicamente quando extraída de uma distribuição uniforme [0,1]?

28

Esta é uma pergunta de entrevista para uma posição quantitativa de analista, relatada aqui . Suponhamos que estamos desenhando a partir de uma distribuição uniforme [0,1] e os empates são iid, qual é o comprimento esperado de uma distribuição que aumenta monotonicamente? Ou seja, paramos de desenhar se o desenho atual for menor ou igual ao desenho anterior.

Pr(length=1)=010x1dx2dx1=1/2
Pr(length=2)=01x110x2dx3dx2dx1=1/3
Pr(length=3)=01x11x210x3dx4dx3dx2dx1=1/8

mas acho que calcular essas integrais aninhadas é cada vez mais difícil e não estou conseguindo o "truque" para generalizar para . Eu sei que a resposta final está estruturada Pr(length=n)

E(length)=n=1nPr(length=n)

Alguma idéia de como responder a essa pergunta?

Amazônia
fonte

Respostas:

37

Aqui estão algumas dicas gerais para resolver esta questão:

Você tem uma sequência de variáveis ​​aleatórias contínuas de IID, o que significa que elas podem ser trocadas . O que isso implica sobre a probabilidade de obter uma ordem específica para os primeiros valores? Com base nisso, qual é a probabilidade de obter uma ordem crescente para os primeiros valores? É possível descobrir isso sem integrar a distribuição das variáveis ​​aleatórias subjacentes. Se você fizer isso bem, poderá obter uma resposta sem nenhuma suposição de uma distribuição uniforme - ou seja, obtém uma resposta que se aplica a qualquer sequência intercambiável de variáveis ​​aleatórias contínuas.nn


Aqui está a solução completa ( não olhe se você deve descobrir isso sozinho ):

Seja sua sequência de variáveis ​​aleatórias contínuas independentes e deixe é o número de elementos crescentes no início da sequência. Como essas são variáveis ​​aleatórias permutáveis ​​contínuas, elas são quase certamente desiguais entre si e qualquer ordem é igualmente provável; portanto, temos: (Observe que esse resultado é válido para qualquer sequência IID de variáveis ​​aleatórias contínuas; elas não precisam ter uma distribuição uniforme.) Portanto, a variável aleatória tem função de massa de probabilidadeU1,U2,U3,IID Continuous DistNmax{nN|U1<U2<<Un}

P(Nn)=P(U1<U2<<Un)=1n!.
N
pN(n)=P(N=n)=1n!1(n+1)!=n(n+1)!.
Você notará que este resultado está de acordo com os valores que você calculou usando a integração sobre os valores subjacentes. (Esta parte não é necessária para a solução; é incluída para fins de completude.) Usando uma regra conhecida para o valor esperado de uma variável aleatória não negativa , temos: Observe novamente que não há nada em nosso trabalho que use a distribuição uniforme subjacente. Portanto, este é um resultado geral que se aplica a qualquer sequência intercambiável de variáveis ​​aleatórias contínuas.
E(N)=n=1P(Nn)=n=11n!=e1=1.718282.

Algumas idéias adicionais:

Pelo trabalho acima, vemos que esse resultado distributivo e o valor esperado resultante não dependem da distribuição subjacente, desde que seja uma distribuição contínua. Isso realmente não é surpreendente, uma vez que consideramos o fato de que toda variável aleatória escalar contínua pode ser obtida por meio de uma transformação monotônica de uma variável aleatória uniforme (com a transformação sendo sua função quantil). Como as transformações monotônicas preservam a ordem de classificação, examinar as probabilidades de ordenar variáveis ​​aleatórias contínuas arbitrárias da IID é o mesmo que analisar as probabilidades de ordenar variáveis ​​aleatórias uniformes da IDI .

Restabelecer Monica
fonte
6
Bem feito! (+1)
jbowman 12/06
1
@Ben eu sigo você até a última equação ... Eu pensei que o valor esperado deveria ser, em vez de ... você pode explicar mais esta parte?
E(N)=n=1P(N=n)n=n=1n2/(n+1)!
E(N)=n=1P(Nn)
Amazônia
5
Essa é uma regra conhecida para o valor esperado de uma variável aleatória não negativa . Usando uma técnica que envolve a troca da ordem dos somatórios, você tem: Portanto, você deve achar que .
E(N)=n=1nP(N=n)=n=1k=1nP(N=n)=n=1k=nP(N=k)=n=1P(Nn).
n1n!=nn2(n+1)!
Reintegrar Monica
Você pode explicar por que ? P(Nn)=P(U1<U2<<Un)
badmax 14/01
1
@badmax: A variável aleatória é o número de elementos crescentes de no início da sequência (veja sua definição). Portanto, se isso significa que há pelo menos elementos crescentes no início da sequência. Isso significa que os primeiros elementos devem estar em ordem crescente, que é . NUNnnnU1<U2<<Un
Restabelecer Monica
8

Outro método de solução que fornece a solução para um caso mais geral.

Suponha que seja o comprimento esperado de uma sequência monotônica , de modo que . O valor que queremos calcular é . E sabemos que . Condicionamento no próximo valor,F(x){x1,x2,...}xx1x2F(0)F(1)=0

F(x)=0xπ(y)0dy+x1π(y)(1+F(y))dy=x11+F(y)dy

onde é a densidade U [0,1]. tãoπ(y)=1

F(x)=(1+F(x))

Resolvendo com a condição de contorno , obtemos . Portanto, .F(1)=0F(x)=e(1x)1F(0)=e1

jf328
fonte
2
Isso é muito inteligente. Apenas para explicar um pouco: suas observações são de que 1) se é o comprimento da maior seqüência inicial inicial menos um, é o suficiente para determinar e definir , e 2) é zero se e de outra forma. Como obtemos , que no caso uniforme pode ser resolvido diretamente. LE(L|X0=x)=:F(x)x=0E(L|X0=x,X1=y)y<x1+E(L|X0=y)E(L|X0=x)=E(E(L|X0=x,X1))=RfX(y)E(L|X0=x,X1=y)dy=x1fX(y)(1+E(L|X0=y))dy=x1fX(y)(1+F(y))dyF(x)=fX(x)(1+F(x))
Matthew Towers
2
+1 Muito inteligente mesmo. Mas como a resposta final não depende da distribuição (como a outra resposta discute), esse cálculo também não deve, de alguma forma, depender de . Existe alguma maneira de vê-lo? CC para @m_t_. π(y)
Ameba diz Reinstate Monica
3
@amoeba Concordo que não deve depender da distribuição dos s, mas outros valores de devem: a solução geral desse DE éF(0)XFF=Ceπ1
Matthew Towers
1
@MartijnWeterings Acho que , não 1, por exemplo, no caso uniforme, obtemosC=eeex1
Matthew Towers
1
Sim você está certo. Usei o caso uniforme para deduzir minha afirmação, mas usei falsamente vez dece1x1cex1
Sextus
0

Outro método de solução é calcular a integral diretamente.

A probabilidade de gerar uma sequência cuja parte crescente tem comprimento de é , onde .nfn(0)fn(x)=x1x11x21...xn21xn11dxndxn1...dx2dx1

O que precisamos fazer é calcular .fn(0)

Se você tentar calcular os primeiros , talvez descubra quefn(x)fn(x)=t=0n(x)tt!(nt)!

Caso base: quando ,n=1f1(x)=t=01(x)tt!(nt)!=1x=x1dx1

Hipótese indutiva: quando ,n=kfn(x)=t=0k(x)tt!(kt)! , for k1

Etapa indutiva: quando ,n=k+1

     fn(x)=fk+1(x)=x1fk(x)dx

=x1t=0k(x)tt!(kt)!dx

=t=0k(x)t+1t!(kt)!×(t+1)|x1=t=0k(x)t+1(t+1)!(kt)!|x1

=t=1k+1(x)tt!(kt+1)!|x1

=t=1k+1(1)t+1t!(kt+1)!+t=1k+1(x)tt!(kt+1)!

=t=1k+1(1)t+1Ctk+1(k+1)!+t=1k+1(x)tt!(kt+1)!

=1(k+1)!+t=0k+1(1)t+1Ctk+1(k+1)!+t=1k+1(x)tt!(kt+1)!

=1(k+1)!(11)k+1(k+1)!+t=1k+1(x)tt!(kt+1)!

=t=0k+1(x)tt!(kt+1)!

Por indução matemática, a suposição é válida.

Assim, obtemos quefn(0)=1n!

Então,E(length)=n=1Pr(lengthn)=n=11n!=e1

劉家維
fonte