Provando pular listas fortemente equilibradas em relação às expectativas

8

Dada uma lista de pulos de altura , qual é o comprimento esperado para um fator constante (multiplicativo)?n

Na seção 2.2 das Árvores B sem cache , as Árvores de pesquisa fortemente equilibradas são definidas como:

Para alguma constante , todo nó na altura tem descendentes .dvhΘ(dh)

Eles afirmam:

As árvores de pesquisa que atendem às Propriedades 1 e 2 incluem árvores B com ponderação de peso, listas de pulos determinísticos e listas de pulos no sentido esperado.

Eu já perguntei sobre a reivindicação de listas de pulos deterministas. Esta pergunta é sobre a reivindicação de ignorar listas.

Acredito que as listas de ignorados têm essa propriedade em expectativa, mas não consigo encontrar uma razão rigorosa. A probabilidade inversa (qual é a altura, dado o comprimento) pode ser calculada diretamente dentro de um fator constante. Uma análise sofisticada é fornecida em A transformação binomial e a análise de ignorar listas .

Editar:

Existem várias noções diferentes para definir "descendentes" em pular listas; esse termo não é usado no artigo original de Pugh. Algumas interpretações possíveis de "descendentes" vêm da exibição de listas de pulos como árvores. Diferentes maneiras de fazer isso estão incluídas no

Usando a noção de "Lista de pulos determinísticos", acho que essa é outra maneira de fazer a mesma pergunta:

Se eu pegar uma moeda justa, jogue-a algumas vezes para que meu último resultado seja coroa , e a sequência contínua mais longa de cabeças tenha o comprimento , qual é o valor esperado do número de vezes que eu vi coroa ?n

Eu também estaria interessado em provas não construtivas de forte equilíbrio de peso na expectativa, mesmo sem uma solução de formulário fechado para .d

jbapple
fonte
1
Para árvores, a altura coincide com o número máximo de etapas para encontrar qualquer elemento. Este não é o caso da altura das torres da lista de ignorados. Por exemplo, suponha que o primeiro elemento tem uma torre de altura ( o comprimento da lista), que liga a todos os outros elementos da lista. A altura da árvore associada seria 1 resp 2 (como você conta?) Então. Então, qual a quantidade que você deseja investigar? Altura da torre ou custo de pesquisa? n1n
Raphael
Acho que entendi o que você quer dizer, Raphael - no contexto da definição original de "altura" fortemente listada, com peso equilibrado, "altura" não é "altura" da árvore. Na verdade, estou interessado em ambos, embora minha pergunta fosse sobre altura da torre.
jbapple
1
P(h(x)=n|l(x)=j)=P(h(x)n|l(x)=j)P(h(x)n|l(x)=j) não aguenta; os eventos não são independentes.
Raphael
Claro, Raphael, obrigado. Editando agora.
jbapple
2
Tomando sua pergunta reformulada "Se eu pegar uma moeda [...] justa", você pode obter uma resposta razoável em mathoverflow, se não encontrar nada aqui. Se você postar lá, coloque um link aqui também.
Raphael

Respostas:

3

Como você perguntou, a pergunta sobre o comprimento esperado (dada a altura) não faz sentido sem uma distribuição prévia no comprimento da string.

Em vez disso, você deve considerar o número de vezes que obtém coroa antes de obter cabeças seguidas, pois isso fornecerá o número de descendentes de um nó de altura em uma lista de ignorados. Vamos representar esse valor com a variável aleatória . Quando começamos, ou logo após recebermos coroa, a probabilidade de começar e terminar uma sequência de ou mais caras antes de voltar a coroa é . Se nós batemos caudas antes de começar cabeças em uma fileira, estamos de volta para um quadrado. Assim, é realmente distribuído como e temos .h X = X ( h ) h 2 - h h X G e o m e t r i c ( 2 - h ) E ( X ) = ( 1 - 2 - h ) 2 hhhX=X(h)h2hhXGeometric(2h)E(X)=(12h)2h

Editar:

Desculpe, isso fornece o número esperado de torres na subárvore esquerda. O número de nós na subárvore esquerda será da mesma ordem de magnitude, pois as torres entre o primeiro e o último terão altura geometricamente distribuída com o valor esperado 2. Além disso, se você quiser considerar também a subárvore direita, qual provavelmente faz mais sentido, basta ir até obter cabeças seguidas em vez de apenas . Nesse caso, você obtém o número de descendentes, conforme definido no artigo de Devroye ao qual você vinculou.hh+1h

James King
fonte
"Em vez disso, você deve considerar o número de vezes que obtém caudas antes de obter h cabeças seguidas, pois isso fornecerá o número de descendentes de um nó de altura h em uma lista de pulos". Você pode explicar isso com mais detalhes? Existem várias traduções diferentes de pular listas para árvores e elas fornecem diferentes nós diferentes descendentes. Vou editar a pergunta para tentar ser mais específico.
jbapple
OK, adicionei algumas informações sobre possíveis significados diferentes de "descendentes". Suspeito que sua interpretação corresponda à de pelo menos dois dos outros.
jbapple
Considere um nó no topo de uma torre de altura no índice horizontal , com a próxima torre de altura ou mais tendo o índice . Os descendentes do nó são exatamente os nós em todas as torres com índice pelo menos estritamente menor que . No artigo de Devroye, isso é equivalente ao conjunto de descendentes na subárvore esquerda de um nó. i h j > i i jhihj>iij
James King
2

Na sua reformulação da questão, você fixa o número de vezes que joga a moeda? Caso contrário, não é necessário fazer uma distribuição para quando você parar de jogar a moeda?

VPatel
fonte
Não, eu não fixo o número de vezes que jogo a moeda. Talvez seja necessário fazer uma distribuição, mas não tenho certeza. Minha tradução do problema está incorreta? A formulação original tem uma resposta bem definida sem fixar algum tipo de distribuição?
jbapple
Eu acho que a questão (reformulada) não faz sentido sem algumas informações extras. Eu realmente não sei nada sobre a pergunta original, então não posso comentar sobre a tradução.
VPatel
1

Permita que para defina variáveis ​​aleatórias sobre com (altura da torre ). Seja com . Então:HiiN+N+Pr[Hi=k]=2k1iH=max{Hii=1,,N}NN+

Pr[HkN]=1i=1NPr[Hi<k]=1(12k)n .

Agora podemos calcular a probabilidade de dado : . O zero da primeira derivada parcial wrt da expressão é encontrado em (usando Wolfram Alpha). Observe que eu não era capaz / estava ansioso o suficiente para verificar se isso é realmente o máximo. Se for, é o estimador de probabilidade máxima para o comprimento da lista de pulos dada a altura máxima da torre .H=kNPr[H=kN]=Pr[HkN]Pr[Hk+1N]=(12k1)n(12k)nNNk=ln(ln(12k)ln(12k1))ln(12k1)ln(12k)NkNk

Alguns valores, arredondados para o número inteiro mais próximo:

k    N^*_k
1    2
2    5
3    11
4    22
5    44
10   1419
20   1.5e6

Isso parece razoável; convém verificar se . Espero que a altura esperada de uma lista de pulos de comprimento fixo seja um resultado padrão.E[kNk]k

Alguém tem uma boa idéia de como obter um assintótico para ? A expressão que encontrei não é muito útil.Nk

Rafael
fonte