Qual é a profundidade esperada de uma árvore gerada aleatoriamente?

19

Eu pensei sobre esse problema há muito tempo, mas não tenho idéias.

O algoritmo de geração é o seguinte. Assumimos que existem nós distintos numerados de a . Então, para cada em , tornamos o pai do nó na árvore um nó aleatório em . Faça a iteração de cada para que o resultado seja uma árvore aleatória com o nó raiz . (Talvez isso não seja aleatório o suficiente, mas isso não importa.)n0n1i{1,,n1}i{0,,i1}i0

Qual é a profundidade esperada dessa árvore?

zhxchen17
fonte
Presumo que seja root e você quis dizer: "Então, para cada em , criamos o pai do ésimo nó ...". Certo? v0i[1,n)i
Sem título
O que você tentou? Você já tentou escrever uma relação de recorrência, digamos para qual é a profundidade esperada do nó ? d(i)i
DW
3
Esses objetos são conhecidos sob o nome "árvore recursiva aleatória".
James Martin

Respostas:

15

Acho que há um resultado de concentração sobre , mas ainda não preenchi os detalhes.elogn

Podemos obter um limite superior para a probabilidade de que node tem antepassados não incluindo . Para cada cadeia completa possível de ancestrais diferentes de zero , a probabilidade de que a cadeia é . Isso corresponde a vezes um termo de onde os termos são solicitados. Portanto, um limite superior para essa probabilidade é que é o ° número harmônicod 0 d ( um 1 , um 2 , . . . , um d ) ( 1nd0d(a1,a2,...,ad) 1(1a1)(1a2)(1ad)×1n (1+11n1(1+12+13+1n1)d H n - 1 n - 1 1 + 11n(d!)Hn1dHn1n1 hn1+12+...+1n1 . . Para fixo e , a probabilidade de o nó estar na profundidade é no máximodnnd+1Hn1log(n1)+γdnnd+1

(logn)dn(d!)(1+o(1))

Pela aproximação de Stirling, podemos estimar isso como

1n2πd(elognd)d.

Para grande , qualquer coisa muito maior que , a base do exponencial é pequena, portanto esse limite é pequeno, e podemos usar a união vinculada para dizer que a probabilidade de existir pelo menos um nó com ancestrais diferentes de zero é pequeno.e log n ddelognd


Vejo

Luc Devroye, Omar Fawzi, Nicolas Fraiman. "Propriedades de profundidade de árvores recursivas aleatórias de anexo em escala."

B. Pittel. Observe as alturas das árvores recursivas aleatórias e das árvores de pesquisa aleatória. Random Structures and Algorithms, 5: 337–348, 1994.

O primeiro afirma que o último mostrou que a profundidade máxima é com alta probabilidade e oferece outra prova.(e+o(1))logn

Douglas Zare
fonte
2
Muito agradável. Para esclarecer para outros leitores: como você não pode repetir um , o termo é apenas um limite superior . ( 1 + 1ai(1+12++1n1)d
quer
3

Esta pergunta foi respondida há vários anos, mas, apenas por diversão, aqui está uma prova simples do limite superior. Damos um limite à expectativa, depois um limite à cauda.

Defina rv como a profundidade do nó . Defina i { 0 , 1 , , n - 1 } ϕ i = i jdii{0,1,,n1}ϕi=j=0iedj.

lema 1. A profundidade máxima esperada, é no máximo .eE[maxidi]eHn1

Prova. A profundidade máxima é no máximo . Para finalizar, mostramos .lnϕn1E[lnϕn1]eHn1

Para qualquer , condicionado em , pela inspeção de , ϕ i - 1i1ϕi1E [ φ iϕi

E[ϕi|ϕi1]=ϕi1+E[edi]=ϕi1+eiϕi1=(1+ei)ϕi1.

Por indução, segue-se que

E[ϕn1]=i=1n1(1+ei)<i=1n1exp(ei)=exp(eHn1).

Portanto, pela concavidade do logaritmo,

E[lnϕn1]lnE[ϕn1]<lnexp(eHn1)=eHn1.       

Aqui está a cauda:

lema 2. Corrija qualquer . Então é no máximo .Pr [ max i d i ] ec0exp ( - c )Pr[maxidi]eHn1+cexp(c)

Prova. Pela inspeção de e do limite de Markov, a probabilidade em questão é no máximo A partir da prova do Lema 1, . Substituir isso no lado direito acima completa a prova. Pr [ ϕ n - 1exp ( eϕE[ϕn-1]exp(e

Pr[ϕn1exp(eHn1+c)]E[ϕn1]exp(eHn1+c).
E[ϕn1]exp(eHn1)   

Quanto ao limite inferior, acho que o limite inferior de segue com bastante facilidade considerando . Mas...max i d iln ϕ t - ln n(e1)HnO(1)maxidilnϕtlnn [EDIT: falou cedo demais]

Não parece tão fácil mostrar o limite inferior apertado, de ...(1o(1))eHn

Neal Young
fonte
2

Na verdade, eu pensei na mesma pergunta (embora em uma formulação completamente diferente) há alguns meses atrás, bem como em algumas variantes próximas.

Eu não tenho uma solução de forma fechada (/ assintótica), mas você pode achar útil esse ponto de vista (você está procurando apenas o limite superior, talvez?).

O processo que você descreve aqui é uma generalização do Processo de Restaurante Chinês , em que cada "tabela" é uma subárvore cujo pai da raiz é .v0

Isso também nos fornece uma fórmula de recursão para sua pergunta.

Denote por as alturas esperadas de um processo dessa árvore com nós.nh(n)n

Denotado por (A probabilidade de distribuição dos nós em subárvores).Pn(B)=ΠbB(b1)!n!B

Então a quantidade que você está procurando, , é dada por:h(n)

h(n)=BBnPn(B)maxbBh(b)

Se você deseja codificar essa recursão, use o seguinte para que não entre em loop infinito:

h(n)=BBn{{n}}Pn(B)maxbBh(b)11n!

Onde é o conjunto de todas as partições de bolas idênticas em qualquer número de compartimentos não vazios, . nh(1)=1Bnnh(1)=1


Na prática, quando eu precisei disso, usei apenas um método simples de monte-carlo para estimar , pois tentar calcular por esse método é extremamente ineficiente.hh(n)h

RB
fonte
11
Obrigado pela ideia! Na verdade, escrevi um programa de Monte Carlo na primeira vez em que me deparei com esse problema, mas, para minha surpresa, o resultado exato é tão difícil de obter.
precisa saber é o seguinte