Encontre o menor elemento k em uma árvore de pesquisa binária da maneira ideal

112

Preciso encontrar o menor elemento k na árvore de pesquisa binária sem usar qualquer variável estática / global. Como conseguir isso de forma eficiente? A solução que tenho em mente é fazer a operação em O (n), o pior caso, já que estou planejando fazer um percurso inordenado de toda a árvore. Mas, no fundo, sinto que não estou usando a propriedade BST aqui. A minha solução presumida está correta ou existe uma melhor disponível?

fanfarrão
fonte
7
A árvore está equilibrada?
kennytm
Não é. Mas se fosse equilibrado, existe uma maneira ideal?
bragboy
1
Se você fizer uma pesquisa em "Estatísticas de pedidos", encontrará o que precisa.
RAL
Eu meio que sinto a maioria das respostas abaixo, embora corretas estejam enganando, pois estão usando uma variável global de algum tipo (seja uma referência a um inteiro ou uma variável que é diminuída e retornada). Se absolutamente nada disso for permitido, eu usaria a recursão sem que nenhuma referência fosse passada.
Henley Chiu

Respostas:

170

Aqui está apenas um esboço da ideia:

Em um BST, a subárvore esquerda do nó Tcontém apenas elementos menores do que o valor armazenado em T. Se kfor menor que o número de elementos na subárvore esquerda, o kmenor elemento deve pertencer à subárvore esquerda. Caso contrário, se kfor maior, o kmenor elemento está na subárvore direita.

Podemos aumentar o BST para que cada nó armazene o número de elementos em sua subárvore esquerda (suponha que a subárvore esquerda de um determinado nó inclua esse nó). Com essa informação, é simples atravessar a árvore perguntando repetidamente pelo número de elementos na subárvore esquerda, para decidir se deve recursar para a subárvore esquerda ou direita.

Agora, suponha que estejamos no nó T:

  1. Se k == num_elements (subárvore esquerda de T) , então a resposta que estamos procurando é o valor no nó T.
  2. Se k> núm_elementos (subárvore esquerda de T) , então obviamente podemos ignorar a subárvore esquerda, porque esses elementos também serão menores do que o kmenor. Portanto, reduzimos o problema para encontrar o k - num_elements(left subtree of T)menor elemento da subárvore certa.
  3. Se k <num_elementos (subárvore esquerda de T) , então o késimo menor está em algum lugar na subárvore esquerda, então reduzimos o problema para encontrar o késimo elemento na subárvore esquerda.

Análise de complexidade:

Isso leva O(depth of node)tempo, que é O(log n)no pior caso em um BST balanceado ou, O(log n)em média, em um BST aleatório.

Um BST requer O(n)armazenamento e outro O(n)para armazenar as informações sobre o número de elementos. Todas as operações BST levam O(depth of node)tempo, e leva O(depth of node)tempo extra para manter as informações do "número de elementos" para inserção, exclusão ou rotação de nós. Portanto, o armazenamento de informações sobre o número de elementos na subárvore esquerda mantém a complexidade de espaço e tempo de um BST.

IVlad
fonte
59
Para encontrar o enésimo menor item, você só precisa armazenar o tamanho da subárvore esquerda. Você usaria o tamanho da subárvore certa se também quisesse encontrar o enésimo maior item. Na verdade, você pode tornar isso mais barato: armazene o tamanho total da árvore na raiz e o tamanho da subárvore esquerda. Quando você precisa dimensionar a subárvore direita, você pode subtrair o tamanho da esquerda do tamanho total.
Jerry Coffin
37
Esse BST aumentado é chamado de 'árvore de estatísticas do pedido'.
Daniel
10
@Ivlad: na etapa 2: Eu acho que "k - num_elements" deveria ser "k - num_elements -1", já que você deve incluir o elemento raiz também.
understack
1
@understack - não se você assumir que a raiz faz parte da subárvore.
IVlad
16
Se a árvore não contiver um campo contendo o "número de elementos em sua subárvore esquerda e direita", o método acabará sendo BigO (n), pois você precisará percorrer a subárvore direita ou esquerda em cada nó para calcule o índice k do nó atual.
Robert S. Barnes
68

Uma solução mais simples seria fazer um percurso em ordem e acompanhar o elemento a ser impresso no momento (sem imprimi-lo). Quando chegarmos a k, imprima o elemento e pule o resto da travessia da árvore.

void findK(Node* p, int* k) {
  if(!p || k < 0) return;
  findK(p->left, k);
  --k;
  if(k == 0) { 
    print p->data;
    return;  
  } 
  findK(p->right, k); 
}
prasadvk
fonte
1
+1: A ideia está na direção certa, mas algumas pontas soltas podem precisar ser apertadas; consulte stackoverflow.com/a/23069077/278326
Arun
1
Gosto desta solução, uma vez que o BST já está ordenado, um percurso deve ser suficiente.
Merlin
3
Se n for próximo ao número total de nós nesta árvore, seu algoritmo levará O (n) tempo para terminar, o que é ruim para a resposta selecionada-O (log n)
Spark8006
13
public int ReturnKthSmallestElement1(int k)
    {
        Node node = Root;

        int count = k;

        int sizeOfLeftSubtree = 0;

        while(node != null)
        {

            sizeOfLeftSubtree = node.SizeOfLeftSubtree();

            if (sizeOfLeftSubtree + 1 == count)
                return node.Value;
            else if (sizeOfLeftSubtree < count)
            {
                node = node.Right;
                count -= sizeOfLeftSubtree+1;
            }
            else
            {
                node = node.Left;
            }
        }

        return -1;
    }

esta é a minha implementação em C # baseada no algoritmo acima apenas pensei em postá-la para que as pessoas entendam melhor que funciona para mim

obrigado IVlad

Pára
fonte
11

Uma solução mais simples seria fazer um percurso em ordem e manter o controle do elemento a ser impresso com um contador k. Quando chegarmos a k, imprima o elemento. O tempo de execução é O (n). Lembre-se de que o tipo de retorno da função não pode ser nulo, ele deve retornar seu valor atualizado de k após cada chamada recursiva. Uma solução melhor para isso seria um BST aumentado com um valor de posição classificado em cada nó.

public static int kthSmallest (Node pivot, int k){
    if(pivot == null )
        return k;   
    k = kthSmallest(pivot.left, k);
    k--;
    if(k == 0){
        System.out.println(pivot.value);
    }
    k = kthSmallest(pivot.right, k);
    return k;
}
Sumit Balani
fonte
Acho que sua solução é melhor em termos de complexidade de espaço, em comparação com o BST aumentado.
zach de
A pesquisa não para mesmo depois que o k-ésimo menor elemento é encontrado.
Vineeth Chitteti
10

// adiciona uma versão java sem recursão

public static <T> void find(TreeNode<T> node, int num){
    Stack<TreeNode<T>> stack = new Stack<TreeNode<T>>();

    TreeNode<T> current = node;
    int tmp = num;

    while(stack.size() > 0 || current!=null){
        if(current!= null){
            stack.add(current);
            current = current.getLeft();
        }else{
            current = stack.pop();
            tmp--;

            if(tmp == 0){
                System.out.println(current.getValue());
                return;
            }

            current = current.getRight();
        }
    }
}
Jiaji Li
fonte
Gosto desta solução e da solução recursiva correspondente. Honestamente, a maioria das respostas a esta pergunta é muito confusa / complexa para ler.
Henley Chiu
Eu amo essa solução! Claro e ótimo!
Rugal,
Esta solução é percorrer a árvore 'em ordem' e diminuir um contador após visitar o nó, para parar mais tarde quando o contador chegar a zero. O pior caso é então da ordem O (n). Não é a melhor comparação com as soluções recursivas de @ IVlad cujo pior caso leva O (log n)
Jorge P.
4

Dada apenas uma árvore de pesquisa binária simples, tudo o que você pode fazer é começar do menor e percorrer para cima para encontrar o nó correto.

Se você vai fazer isso com muita frequência, pode adicionar um atributo a cada nó, indicando quantos nós estão em sua subárvore esquerda. Usando isso, você pode descer da árvore diretamente para o nó correto.

Jerry Coffin
fonte
4

Caminhada recursiva em ordem com um contador

Time Complexity: O( N ), N is the number of nodes
Space Complexity: O( 1 ), excluding the function call stack

A ideia é semelhante à solução @prasadvk, mas tem algumas deficiências (veja as notas abaixo), então estou postando isso como uma resposta separada.

// Private Helper Macro
#define testAndReturn( k, counter, result )                         \
    do { if( (counter == k) && (result == -1) ) {                   \
        result = pn->key_;                                          \
        return;                                                     \
    } } while( 0 )

// Private Helper Function
static void findKthSmallest(
    BstNode const * pn, int const k, int & counter, int & result ) {

    if( ! pn ) return;

    findKthSmallest( pn->left_, k, counter, result );
    testAndReturn( k, counter, result );

    counter += 1;
    testAndReturn( k, counter, result );

    findKthSmallest( pn->right_, k, counter, result );
    testAndReturn( k, counter, result );
}

// Public API function
void findKthSmallest( Bst const * pt, int const k ) {
    int counter = 0;
    int result = -1;        // -1 := not found
    findKthSmallest( pt->root_, k, counter, result );
    printf("%d-th element: element = %d\n", k, result );
}

Observações (e diferenças da solução de @prasadvk):

  1. if( counter == k )o teste é exigido em três locais: (a) após a subárvore esquerda, (b) após a raiz e (c) após a subárvore direita. Isso é para garantir que o k-ésimo elemento seja detectado em todos os locais , ou seja, independentemente da subárvore em que está localizado.

  2. if( result == -1 )teste necessário para garantir que apenas o elemento de resultado seja impresso , caso contrário, todos os elementos começando do k-ésimo menor até a raiz são impressos.

Uma corrida
fonte
A complexidade de tempo para esta solução é O(k + d), onde dé a profundidade máxima da árvore. Portanto, ele usa uma variável global, countermas é ilegal para esta questão.
Valentin Shergin
Oi Arun, você pode explicar com um exemplo. Não estou entendendo este particularmente seu primeiro ponto.
Andy897
3

Para árvore de busca não balanceada, leva O (n) .

Para uma árvore de busca balanceada , leva O (k + log n) no pior caso, mas apenas O (k) no sentido amortizado .

Ter e gerenciar o inteiro extra para cada nó: o tamanho da subárvore dá complexidade de tempo O (log n) . Essa árvore de pesquisa equilibrada é normalmente chamada de RankTree.

Em geral, existem soluções (baseadas não em árvore).

Saudações.

Slava
fonte
1

Isso funciona bem: status: é a matriz que contém se o elemento foi encontrado. k: é o kº elemento a ser encontrado. contagem: mantém o controle do número de nós percorridos durante a travessia da árvore.

int kth(struct tree* node, int* status, int k, int count)
{
    if (!node) return count;
    count = kth(node->lft, status, k, count);  
    if( status[1] ) return status[0];
    if (count == k) { 
        status[0] = node->val;
        status[1] = 1;
        return status[0];
    }
    count = kth(node->rgt, status, k, count+1);
    if( status[1] ) return status[0];
    return count;
}
pranjal
fonte
1

Embora esta definitivamente não seja a solução ideal para o problema, é outra solução potencial que pensei que algumas pessoas poderiam achar interessante:

/**
 * Treat the bst as a sorted list in descending order and find the element 
 * in position k.
 *
 * Time complexity BigO ( n^2 )
 *
 * 2n + sum( 1 * n/2 + 2 * n/4 + ... ( 2^n-1) * n/n ) = 
 * 2n + sigma a=1 to n ( (2^(a-1)) * n / 2^a ) = 2n + n(n-1)/4
 *
 * @param t The root of the binary search tree.
 * @param k The position of the element to find.
 * @return The value of the element at position k.
 */
public static int kElement2( Node t, int k ) {
    int treeSize = sizeOfTree( t );

    return kElement2( t, k, treeSize, 0 ).intValue();
}

/**
 * Find the value at position k in the bst by doing an in-order traversal 
 * of the tree and mapping the ascending order index to the descending order 
 * index.
 *
 *
 * @param t Root of the bst to search in.
 * @param k Index of the element being searched for.
 * @param treeSize Size of the entire bst.
 * @param count The number of node already visited.
 * @return Either the value of the kth node, or Double.POSITIVE_INFINITY if 
 *         not found in this sub-tree.
 */
private static Double kElement2( Node t, int k, int treeSize, int count ) {
    // Double.POSITIVE_INFINITY is a marker value indicating that the kth 
    // element wasn't found in this sub-tree.
    if ( t == null )
        return Double.POSITIVE_INFINITY;

    Double kea = kElement2( t.getLeftSon(), k, treeSize, count );

    if ( kea != Double.POSITIVE_INFINITY )
        return kea;

    // The index of the current node.
    count += 1 + sizeOfTree( t.getLeftSon() );

    // Given any index from the ascending in order traversal of the bst, 
    // treeSize + 1 - index gives the
    // corresponding index in the descending order list.
    if ( ( treeSize + 1 - count ) == k )
        return (double)t.getNumber();

    return kElement2( t.getRightSon(), k, treeSize, count );
}
Robert S. Barnes
fonte
1

assinatura:

Node * find(Node* tree, int *n, int k);

ligue como:

*n = 0;
kthNode = find(root, n, k);

definição:

Node * find ( Node * tree, int *n, int k)
{
   Node *temp = NULL;

   if (tree->left && *n<k)
      temp = find(tree->left, n, k);

   *n++;

   if(*n==k)
      temp = root;

   if (tree->right && *n<k)
      temp = find(tree->right, n, k);

   return temp;
}
Alvo
fonte
1

Bem, aqui estão meus 2 centavos ...

int numBSTnodes(const Node* pNode){
     if(pNode == NULL) return 0;
     return (numBSTnodes(pNode->left)+numBSTnodes(pNode->right)+1);
}


//This function will find Kth smallest element
Node* findKthSmallestBSTelement(Node* root, int k){
     Node* pTrav = root;
     while(k > 0){
         int numNodes = numBSTnodes(pTrav->left);
         if(numNodes >= k){
              pTrav = pTrav->left;
         }
         else{
              //subtract left tree nodes and root count from 'k'
              k -= (numBSTnodes(pTrav->left) + 1);
              if(k == 0) return pTrav;
              pTrav = pTrav->right;
        }

        return NULL;
 }
Manish Shukla
fonte
0

Isso é o que eu pensei e funciona. Ele será executado em o (log n)

public static int FindkThSmallestElemet(Node root, int k)
    {
        int count = 0;
        Node current = root;

        while (current != null)
        {
            count++;
            current = current.left;
        }
        current = root;

        while (current != null)
        {
            if (count == k)
                return current.data;
            else
            {
                current = current.left;
                count--;
            }
        }

        return -1;


    } // end of function FindkThSmallestElemet
Aprendiz
fonte
3
não acho que essa solução funcione. E se o K-ésimo menor estiver na subárvore direita do nó da árvore?
Anil Vishnoi,
0

Bem, podemos simplesmente usar o percurso em ordem e colocar o elemento visitado em uma pilha. pop k número de vezes, para obter a resposta.

também podemos parar após k elementos

kartheek babu
fonte
1
esta não é uma solução ideal
bragboy
0

Solução para o caso BST completo: -

Node kSmallest(Node root, int k) {
  int i = root.size(); // 2^height - 1, single node is height = 1;
  Node result = root;
  while (i - 1 > k) {
    i = (i-1)/2;  // size of left subtree
    if (k < i) {
      result = result.left;
    } else {
      result = result.right;
      k -= i;
    }  
  }
  return i-1==k ? result: null;
}
gvijay
fonte
0

O kernel do Linux tem uma excelente estrutura de dados em árvore vermelha e preta aumentada que suporta operações baseadas em classificação em O (log n) em linux / lib / rbtree.c.

Uma porta Java muito simples também pode ser encontrada em http://code.google.com/p/refolding/source/browse/trunk/core/src/main/java/it/unibo/refolding/alg/RbTree.java , junto com RbRoot.java e RbNode.java. O n'ésimo elemento pode ser obtido chamando RbNode.nth (nó RbNode, int n), passando a raiz da árvore.

Daniel
fonte
0

Aqui está uma versão concisa em C # que retorna o menor elemento k-th, mas requer a passagem de k como um argumento ref (é a mesma abordagem que @prasadvk):

Node FindSmall(Node root, ref int k)
{
    if (root == null || k < 1)
        return null;

    Node node = FindSmall(root.LeftChild, ref k);
    if (node != null)
        return node;

    if (--k == 0)
        return node ?? root;
    return FindSmall(root.RightChild, ref k);
}

É O (log n) para encontrar o menor nó e, em seguida, O (k) para atravessar para o k-ésimo nó, então é O (k + log n).

Erhhung
fonte
que tal a versão java?
Henley Chiu
0

Não consegui encontrar um algoritmo melhor ... então decidi escrever um :) Corrija-me se estiver errado.

class KthLargestBST{
protected static int findKthSmallest(BSTNode root,int k){//user calls this function
    int [] result=findKthSmallest(root,k,0);//I call another function inside
    return result[1];
}
private static int[] findKthSmallest(BSTNode root,int k,int count){//returns result[]2 array containing count in rval[0] and desired element in rval[1] position.
    if(root==null){
        int[]  i=new int[2];
        i[0]=-1;
        i[1]=-1;
        return i;
    }else{
        int rval[]=new int[2];
        int temp[]=new int[2];
        rval=findKthSmallest(root.leftChild,k,count);
        if(rval[0]!=-1){
            count=rval[0];
        }
        count++;
        if(count==k){
            rval[1]=root.data;
        }
        temp=findKthSmallest(root.rightChild,k,(count));
        if(temp[0]!=-1){
            count=temp[0];
        }
        if(temp[1]!=-1){
            rval[1]=temp[1];
        }
        rval[0]=count;
        return rval;
    }
}
public static void main(String args[]){
    BinarySearchTree bst=new BinarySearchTree();
    bst.insert(6);
    bst.insert(8);
    bst.insert(7);
    bst.insert(4);
    bst.insert(3);
    bst.insert(4);
    bst.insert(1);
    bst.insert(12);
    bst.insert(18);
    bst.insert(15);
    bst.insert(16);
    bst.inOrderTraversal();
    System.out.println();
    System.out.println(findKthSmallest(bst.root,11));
}

}

laxman
fonte
0

Aqui está o código java,

max (raiz do nó, int k) - para encontrar o k-ésimo maior

min (raiz do nó, int k) - para encontrar o k-ésimo menor

static int count(Node root){
    if(root == null)
        return 0;
    else
        return count(root.left) + count(root.right) +1;
}
static int max(Node root, int k) {
    if(root == null)
        return -1;
    int right= count(root.right);

    if(k == right+1)
        return root.data;
    else if(right < k)
        return max(root.left, k-right-1);
    else return max(root.right, k);
}

static int min(Node root, int k) {
    if (root==null)
        return -1;

    int left= count(root.left);
    if(k == left+1)
        return root.data;
    else if (left < k)
        return min(root.right, k-left-1);
    else
        return min(root.left, k);
}
code_2_peep
fonte
0

isso funcionaria também. basta chamar a função com maxNode na árvore

def k_largest (self, node, k): if k <0: return None
if k == 0: return node else: k - = 1 return self.k_largest (self.predecessor (node), k)

user2229805
fonte
0

Acho que isso é melhor do que a resposta aceita porque não precisa modificar o nó da árvore original para armazenar o número de seus nós filhos.

Precisamos apenas usar o percurso em ordem para contar o menor nó da esquerda para a direita, pare de pesquisar quando a contagem for igual a K.

private static int count = 0;
public static void printKthSmallestNode(Node node, int k){
    if(node == null){
        return;
    }

    if( node.getLeftNode() != null ){
        printKthSmallestNode(node.getLeftNode(), k);
    }

    count ++ ;
    if(count <= k )
        System.out.println(node.getValue() + ", count=" + count + ", k=" + k);

    if(count < k  && node.getRightNode() != null)
        printKthSmallestNode(node.getRightNode(), k);
}
Jinshui
fonte
0

A melhor abordagem já existe. Mas eu gostaria de adicionar um código simples para isso

int kthsmallest(treenode *q,int k){
int n = size(q->left) + 1;
if(n==k){
    return q->val;
}
if(n > k){
    return kthsmallest(q->left,k);
}
if(n < k){
    return kthsmallest(q->right,k - n);
}

}

int size(treenode *q){
if(q==NULL){
    return 0;
}
else{
    return ( size(q->left) + size(q->right) + 1 );
}}
PrashantKumarNirmal
fonte
0

Usando a classe Result auxiliar para rastrear se o nó é encontrado e k atual.

public class KthSmallestElementWithAux {

public int kthsmallest(TreeNode a, int k) {
    TreeNode ans = kthsmallestRec(a, k).node;
    if (ans != null) {
        return ans.val;
    } else {
        return -1;
    }
}

private Result kthsmallestRec(TreeNode a, int k) {
    //Leaf node, do nothing and return
    if (a == null) {
        return new Result(k, null);
    }

    //Search left first
    Result leftSearch = kthsmallestRec(a.left, k);

    //We are done, no need to check right.
    if (leftSearch.node != null) {
        return leftSearch;
    }

    //Consider number of nodes found to the left
    k = leftSearch.k;

    //Check if current root is the solution before going right
    k--;
    if (k == 0) {
        return new Result(k - 1, a);
    }

    //Check right
    Result rightBalanced = kthsmallestRec(a.right, k);

    //Consider all nodes found to the right
    k = rightBalanced.k;

    if (rightBalanced.node != null) {
        return rightBalanced;
    }

    //No node found, recursion will continue at the higher level
    return new Result(k, null);

}

private class Result {
    private final int k;
    private final TreeNode node;

    Result(int max, TreeNode node) {
        this.k = max;
        this.node = node;
    }
}
}
Alex Fedulov
fonte
0

Complexidade do tempo da solução Python: O (n) Complexidade do espaço: O (1)

A ideia é usar Morris Inorder Traversal

class Solution(object):
def inorderTraversal(self, current , k ):
    while(current is not None):    #This Means we have reached Right Most Node i.e end of LDR traversal

        if(current.left is not None):  #If Left Exists traverse Left First
            pre = current.left   #Goal is to find the node which will be just before the current node i.e predecessor of current node, let's say current is D in LDR goal is to find L here
            while(pre.right is not None and pre.right != current ): #Find predecesor here
                pre = pre.right
            if(pre.right is None):  #In this case predecessor is found , now link this predecessor to current so that there is a path and current is not lost
                pre.right = current
                current = current.left
            else:                   #This means we have traverse all nodes left to current so in LDR traversal of L is done
                k -= 1
                if(k == 0):
                    return current.val
                pre.right = None       #Remove the link tree restored to original here 
                current = current.right
        else:               #In LDR  LD traversal is done move to R 
            k -= 1
            if(k == 0):
                return current.val
            current = current.right

    return 0

def kthSmallest(self, root, k):
    return self.inorderTraversal( root , k  )
Manish Chauhan
fonte
-1

escrevi uma função bacana para calcular o menor elemento k. I usa travessia em ordem e para quando atinge o k-ésimo menor elemento.

void btree::kthSmallest(node* temp, int& k){
if( temp!= NULL)   {
 kthSmallest(temp->left,k);       
 if(k >0)
 {
     if(k==1)
    {
      cout<<temp->value<<endl;
      return;
    }

    k--;
 }

 kthSmallest(temp->right,k);  }}
Tarunjit Singh
fonte
Nenhuma métrica fornecida para explicar por que isso é ideal. Em casos grandes e pequenos
Woot4Moo
-1
int RecPrintKSmallest(Node_ptr head,int k){
  if(head!=NULL){
    k=RecPrintKSmallest(head->left,k);
    if(k>0){
      printf("%c ",head->Node_key.key);
      k--;
    }
    k=RecPrintKSmallest(head->right,k);
  }
  return k;
}
Ebrahim Saada
fonte
2
Sempre acompanhe o código com algum nível de descrição sobre o que ele faz e como ajuda a resolver o problema.
Ren
-1
public TreeNode findKthElement(TreeNode root, int k){
    if((k==numberElement(root.left)+1)){
        return root;
    }
    else if(k>numberElement(root.left)+1){
        findKthElement(root.right,k-numberElement(root.left)-1);
    }
    else{
        findKthElement(root.left, k);
    }
}

public int numberElement(TreeNode node){
    if(node==null){
        return 0;
    }
    else{
        return numberElement(node.left) + numberElement(node.right) + 1;
    }
}
Amazona estou chegando
fonte
-1
public static Node kth(Node n, int k){
    Stack<Node> s=new Stack<Node>();
    int countPopped=0;
    while(!s.isEmpty()||n!=null){
      if(n!=null){
        s.push(n);
        n=n.left;
      }else{
        node=s.pop();
        countPopped++;
        if(countPopped==k){
            return node;
        }
        node=node.right;

      }
  }

}

Ryan
fonte