Provando pular listas fortemente equilibradas em relação às expectativas

Dada uma lista de pulos de altura , qual é o comprimento esperado para um fator constante (multiplicativo)? $n$

Na seção 2.2 das Árvores B sem cache , as Árvores de pesquisa fortemente equilibradas são definidas como:

Para alguma constante , todo nó na altura tem descendentes . $d$ $v$ $h$ $\Theta(d^h)$

Eles afirmam:

As árvores de pesquisa que atendem às Propriedades 1 e 2 incluem árvores B com ponderação de peso, listas de pulos determinísticos e listas de pulos no sentido esperado.

Eu já perguntei sobre a reivindicação de listas de pulos deterministas. Esta pergunta é sobre a reivindicação de ignorar listas.

Acredito que as listas de ignorados têm essa propriedade em expectativa, mas não consigo encontrar uma razão rigorosa. A probabilidade inversa (qual é a altura, dado o comprimento) pode ser calculada diretamente dentro de um fator constante. Uma análise sofisticada é fornecida em A transformação binomial e a análise de ignorar listas .

Editar:

Existem várias noções diferentes para definir "descendentes" em pular listas; esse termo não é usado no artigo original de Pugh. Algumas interpretações possíveis de "descendentes" vêm da exibição de listas de pulos como árvores. Diferentes maneiras de fazer isso estão incluídas no

Usando a noção de "Lista de pulos determinísticos", acho que essa é outra maneira de fazer a mesma pergunta:

Se eu pegar uma moeda justa, jogue-a algumas vezes para que meu último resultado seja coroa , e a sequência contínua mais longa de cabeças tenha o comprimento , qual é o valor esperado do número de vezes que eu vi coroa ? $n$

Eu também estaria interessado em provas não construtivas de forte equilíbrio de peso na expectativa, mesmo sem uma solução de formulário fechado para . $d$

ds.data-structures randomized-algorithms skip-lists jbapple
fonte

Para árvores, a altura coincide com o número máximo de etapas para encontrar qualquer elemento. Este não é o caso da altura das torres da lista de ignorados. Por exemplo, suponha que o primeiro elemento tem uma torre de altura ( o comprimento da lista), que liga a todos os outros elementos da lista. A altura da árvore associada seria 1 resp 2 (como você conta?) Então. Então, qual a quantidade que você deseja investigar? Altura da torre ou custo de pesquisa?

n - 1

$n-1$

n

$n$

Raphael

Acho que entendi o que você quer dizer, Raphael - no contexto da definição original de "altura" fortemente listada, com peso equilibrado, "altura" não é "altura" da árvore. Na verdade, estou interessado em ambos, embora minha pergunta fosse sobre altura da torre.

jbapple

P (h (x) = n | l (x) = j) = P (h (x) \leq n | l (x) = j) * P (h (x) \geq n | l (x) = j)

$P(h(x) = n | l(x) = j) = P(h(x) \leq n | l(x) = j) * P(h(x) \geq n | l(x) = j)$ não aguenta; os eventos não são independentes.

Raphael

Claro, Raphael, obrigado. Editando agora.

jbapple

Tomando sua pergunta reformulada "Se eu pegar uma moeda [...] justa", você pode obter uma resposta razoável em mathoverflow, se não encontrar nada aqui. Se você postar lá, coloque um link aqui também.

Raphael

Respostas:

Como você perguntou, a pergunta sobre o comprimento esperado (dada a altura) não faz sentido sem uma distribuição prévia no comprimento da string.

Em vez disso, você deve considerar o número de vezes que obtém coroa antes de obter cabeças seguidas, pois isso fornecerá o número de descendentes de um nó de altura em uma lista de ignorados. Vamos representar esse valor com a variável aleatória . Quando começamos, ou logo após recebermos coroa, a probabilidade de começar e terminar uma sequência de ou mais caras antes de voltar a coroa é . Se nós batemos caudas antes de começar cabeças em uma fileira, estamos de volta para um quadrado. Assim, é realmente distribuído como e temos . $h$ $h$ $X=X(h)$ $h$ $2^{-h}$ $h$ $X$ $\mathrm{Geometric}(2^{-h})$ $\mathrm{E}(X) = (1-2^{-h})2^h$

Editar:

Desculpe, isso fornece o número esperado de torres na subárvore esquerda. O número de nós na subárvore esquerda será da mesma ordem de magnitude, pois as torres entre o primeiro e o último terão altura geometricamente distribuída com o valor esperado 2. Além disso, se você quiser considerar também a subárvore direita, qual provavelmente faz mais sentido, basta ir até obter cabeças seguidas em vez de apenas . Nesse caso, você obtém o número de descendentes, conforme definido no artigo de Devroye ao qual você vinculou. $h+1$ $h$

James King
fonte

"Em vez disso, você deve considerar o número de vezes que obtém caudas antes de obter h cabeças seguidas, pois isso fornecerá o número de descendentes de um nó de altura h em uma lista de pulos". Você pode explicar isso com mais detalhes? Existem várias traduções diferentes de pular listas para árvores e elas fornecem diferentes nós diferentes descendentes. Vou editar a pergunta para tentar ser mais específico.

jbapple

OK, adicionei algumas informações sobre possíveis significados diferentes de "descendentes". Suspeito que sua interpretação corresponda à de pelo menos dois dos outros.

jbapple

Considere um nó no topo de uma torre de altura no índice horizontal , com a próxima torre de altura ou mais tendo o índice . Os descendentes do nó são exatamente os nós em todas as torres com índice pelo menos estritamente menor que . No artigo de Devroye, isso é equivalente ao conjunto de descendentes na subárvore esquerda de um nó.

h

$h$

i

$i$

h

$h$

j > i

$j>i$

i

$i$

j

$j$

James King

Na sua reformulação da questão, você fixa o número de vezes que joga a moeda? Caso contrário, não é necessário fazer uma distribuição para quando você parar de jogar a moeda?

VPatel
fonte

Não, eu não fixo o número de vezes que jogo a moeda. Talvez seja necessário fazer uma distribuição, mas não tenho certeza. Minha tradução do problema está incorreta? A formulação original tem uma resposta bem definida sem fixar algum tipo de distribuição?

jbapple

Eu acho que a questão (reformulada) não faz sentido sem algumas informações extras. Eu realmente não sei nada sobre a pergunta original, então não posso comentar sobre a tradução.

VPatel

Permita que para defina variáveis aleatórias sobre com (altura da torre ). Seja com . Então: $H_i$ $i \in \mathbb{N}^+$ $\mathbb{N}^+$ $Pr[H_i = k] = 2^{-k-1}$ $i$ $H = \max \{H_i \mid i=1,\dots,N\}$ $N \in \mathbb{N}^+$

$Pr[H \geq k \mid N] = 1 - \prod_{i=1}^{N} Pr[H_i < k] = 1 - (1 - 2^{-k})^n$ .

Agora podemos calcular a probabilidade de dado : . O zero da primeira derivada parcial wrt da expressão é encontrado em (usando Wolfram Alpha). Observe que eu não era capaz / estava ansioso o suficiente para verificar se isso é realmente o máximo. Se for, é o estimador de probabilidade máxima para o comprimento da lista de pulos dada a altura máxima da torre . $H=k$ $N$ $Pr[H = k \mid N] = Pr[H \geq k \mid N] - Pr[H \geq k + 1 \mid N] = (1-2^{-k-1})^n - (1-2^{-k})^n$ $N$ $N^*_k = \frac{\ln\left( \frac{\ln(1 - 2^{-k})}{\ln(1 - 2^{-k - 1})}\right) }{ \ln(1 - 2^{-k-1}) - \ln(1 - 2^{-k})}$ $N^*_k$ $N$ $k$

Alguns valores, arredondados para o número inteiro mais próximo:

Isso parece razoável; convém verificar se . Espero que a altura esperada de uma lista de pulos de comprimento fixo seja um resultado padrão. $\mathbb{E}[k \mid N^*_k] \approx k$

Alguém tem uma boa idéia de como obter um assintótico para ? A expressão que encontrei não é muito útil. $N^*_k$

Rafael
fonte