Como você mencionou, o teorema de Akra – Bazzi mostra que a solução para a recorrência é para todos os . No entanto, isso não revela a natureza da dependência da . Para determinar o último, podemos usar uma abordagem de árvore de recursão.O ( n log n ) p ∈ ( 0 , 1 ) pT(n,p)O(nlogn)p∈(0,1)p
Na raiz da árvore de recursão está o intervalo . Seus dois filhos são os intervalos e , cujo comprimento total é novamente . Cada um desses nós tem dois filhos (assumindo que é grande o suficiente) e assim por diante. Por simplicidade, ignoramos os erros de arredondamento, ou seja, assumimos que é um número inteiro; isso é apenas um detalhe técnico, e eu não me preocuparia com isso. Paramos o processo sempre que um nó tiver comprimento no máximo . A complexidade do algoritmo é proporcional à duração total dos intervalos na árvore. Quando , as folhas{ 1 , ... , p n } { p n + 1 , ... , n } n n p n 1 p ≠ 1 / 2{1,…n}{1,…,pn}{pn+1,…,n}nnpn1p≠1/2 (nós nos quais paramos o processo) têm diferentes profundidades e isso dificulta a determinação da complexidade geral.
Podemos obter um limite superior simples observando que a árvore possui no máximo níveis: cada nó é pelo menos um fator menor que seu pai. Assim como na análise para , a duração total dos intervalos em qualquer nível é no máximo , e obtemos um limite superior de no tempo de execução. Como e para pequeno , podemos escrever isso como .1 - p p = 1 / 2 N O ( n log 1 - P ( 1 / n ) ) log 1 - P ( 1 / n ) = log n / log ( 1 - P ) - 1 log ( 1 - p ) - 1log1−p(1/n)1−pp=1/2nO(nlog1−p(1/n))log1−p(1/n)=logn/log(1−p)−1p O ( n log n / p )log(1−p)−1=−log(1−p)=p±O(p2)pO(nlogn/p)
Aqui está um cálculo mais preciso. Considere o nível . Suponha que não paremos o processo ao atingir um pequeno intervalo. Podemos gerar um vértice aleatório executando etapas, em cada uma das quais vamos para a esquerda (digamos) com probabilidade e direita (digamos) com probabilidade . Cada vez que damos um passo à esquerda, o log da duração do intervalo diminui em , e cada vez que damos um passo à direita, diminui em . Um vértice está na árvore real do log do comprimento diminuído no máximo . O peso total dos intervalos no nívelttp1−p−logp−log(1−p)logntda árvore é exatamente a probabilidade de um vértice gerado de acordo com esse processo corresponder a uma diminuição de no máximo . Ou seja, se é a distribuição que é igual a com probabilidade e para com probabilidade , e são independentes, então o o peso total do nível é . Para a super constante , a variável aleatória é normalmente distribuída normalmente com média variação linear emlognD−logpp−log(1−p)1−pX1,…,Xt∼DttPr[X1+⋯+Xt≤logn]t [ - p log P - ( 1 - P ) log ( 1 - P ) ] t t t [ - p log P - ( 1 - P ) log ( 1 - P ) ] t ≤ ( log n ) / 2 1 t [ - p logX1+⋯+Xt[−plogp−(1−p)log(1−p)]tt, portanto, para satisfazer , digamos, a probabilidade será muito próxima de , enquanto que para satisfazendo , por exemplo, será muito próximo de zero. Definindo (conhecida como função de entropia binária), concluímos que o tempo de execução é (uniforme em , como ). Como , temos e, portanto, nossa estimativa anterior não era rígida.t[−plogp−(1−p)log(1−p)]t≤(logn)/21th ( p ) = - p log p - ( 1 - p ) log ( 1 - p ) Θ ( n log n / h ( p ) ) p n → ∞ p → 0 h ([−plogp−(1−p)log(1−p)]t≥2lognh(p)=−plogp−(1−p)log(1−p)Θ(nlogn/h(p))pn→∞p→0h(p)≈−plogp
Outra forma de olhar para a mesma análise é por ter uma sequência infinita de variáveis aleatórias independentes como antes, e definindo um tempo de paragem de ser a primeira vez que de tal modo que . O tempo de execução é proporcional a . O teorema da renovação elementar afirma então que , implicando que o o tamanho total dos intervalos é igual a . Mais precisamente, para cada constante o tamanho total dos intervalos é , em queT t X 1 + ⋯ + X t ≥ log n n E [ T ] lim n → ∞ E [ T ] / log n = 1 / E [ D ] = 1 / h ( p ) ( 1 + o ( 1 ) ) n log nX1,X2,…TtX1+⋯+Xt≥lognnE[T]limn→∞E[T]/logn=1/E[D]=1/h(p)p ( 1 + α p ( n ) ) n log n / h ( p ) α p ( n ) = o ( n ) log n n α p ( n ) = O ( n - C p ) p ∈ ( δ , 1 - δ ) δ > 0(1+o(1))nlogn/h(p)p(1+αp(n))nlogn/h(p)αp(n)=o(n) . A convergência no teorema da renovação elementar é exponencial no parâmetro de tempo - no nosso caso -, portanto, deve ser polinomial em , ou seja, . A convergência também é provavelmente uniforme para para qualquer .lognnαp(n)=O(n−Cp)p∈(δ,1−δ)δ>0
Resumindo, o comprimento total dos intervalos na árvore de recursão, proporcional ao tempo de execução, é da seguinte forma para cada : onde e são levados para a mesma base e é uma função dependendo de tendendo a com .T ( n , p ) = ( 1 + o ( 1 ) ) n log nplognh(p)=-plogp-(1-p)log(1-p)o(1)p0n
T(n,p)=(1+o(1))nlognh(p),
lognh(p)=−plogp−(1−p)log(1−p)o(1)p0n
Além disso, provavelmente é verdade que, para qualquer e qualquer , é verdade que o comprimento total dos intervalos é da forma que e a grande constante O oculta dependem apenas de . Em particular, deve ser o caso de todas as constantes ,
e a convergência é polinomialmente rápida.δ>0p∈(δ,1−δ)
T(n,p)=(1+O(n−Cδ))nlognh(p),
Cδ>0δp1,p2limn→∞T(n,p1)T(n,p2)=h(p2)h(p1),