Uso índices como a maioria dos desenvolvedores (principalmente no ... bem! Index), mas tenho certeza de que há muitas maneiras sutis de otimizar um banco de dados usando o index. Não tenho certeza se é específico para qualquer implementação de um DBMS.
Minha pergunta é: quais são bons exemplos de como usar o índice (exceto casos básicos e óbvios) e como um DBMS otimiza seu banco de dados quando você especifica um índice em uma tabela?
Respostas:
Pense em um índice como "índice" ... que é uma lista ordenada de ponteiros para posições em um arquivo, também conhecidas como compensações. Digamos que você tenha milhões de registros armazenados em uma tabela, em vez de pesquisar na tabela por critérios de correspondência, é muito mais rápido fazer referência a uma lista ordenada por correspondências e empilhar os ponteiros para as linhas correspondentes específicas. Um exemplo perfeito de um índice é um campo de chave primária de tabelas, geralmente o campo "id". Se você deseja o ID da linha # 11234566, é muito mais rápido solicitar ao índice um ponteiro para os dados do que procurar na fonte de dados a posição 11234566.
Aqui está um uso não tão óbvio da indexação:
Sua operação pode criar seu registro de log, mas depois criar uma referência a um datetime indexado que seja mais rápido para pesquisar / classificar do que sua tabela de log. Em seguida, junte novamente sua tabela de log em sua própria chave primária. Se você precisar que eu expanda isso, me avise. Espero que isto faça sentido.
Consulta de amostra:
fonte
Um ponto que muitas pessoas parecem sentir falta é que um DBMS frequentemente (ou pode apenas) usar apenas um índice por referência de tabela em uma consulta e, se puder e usar vários índices, provavelmente seria mais rápido usar um combinado índice, se presente.
Por exemplo, se pesquisar uma tabela grande por linhas,
WHERE AnIntegerColumn = 42 AND AnOtherInt = 69
o caminho mais rápido para essas linhas seria um índice nas duas colunas AnIntegerColumn e AnOtherInt. Se você tiver apenas um índice em cada um individualmente, mas não um índice combinado, o banco de dados pesquisará um ou outro índice e filtrará os resultados separadamente com a segunda cláusula, ou varrerá os dois e casará os resultados posteriormente.Outra operação simples e comum que pode ser aprimorada com índices compostos é
WHERE SomeColumn = <SomeValue> ORDER BY SomeOtherColumn
: se houver um índice em SomeColumn e SomeOtherColumn (na ordem correta), as operações de filtragem e ordenação poderão ser executadas ao mesmo tempo em algumas circunstâncias.Adicionar índices demais pode ser uma péssima otimização, é claro, pois o espaço extra usado para armazenar os índices (e a carga de IO para mantê-los se o seu banco de dados vê muitas operações de gravação) pode ser um problema pior do que as consultas de leitura um pouco menos ideais , então não exagere.
fonte
David e Randy têm isso coberto. Eu só queria acrescentar que o
EXPLAIN
comando pode ser uma grande ajuda para descobrir quando você terá uma grande economia ao criar um índice, além de sugerir quais índices são necessários. Ele exibirá as etapas que o banco de dados está executando para executar sua consulta, para que você saiba quais bits estão demorando mais tempo.fonte
Algo que ainda não vi mencionado aqui é que, quando você tem mais de um disco, provavelmente deseja colocar seu índice em um disco diferente daquele em que os dados estão. Isso pode acelerar algumas operações. Eu acho que isso merece uma pergunta por si só.
fonte