Custo do operador de busca de índice

9

Para a consulta de banco de dados de exemplo AdventureWorks abaixo:

SELECT 
    P.ProductID, 
    CA.TransactionID
FROM Production.Product AS P
CROSS APPLY
(
    SELECT TOP (1)
        TH.TransactionID
    FROM Production.TransactionHistory AS TH
    WHERE
        TH.ProductID = P.ProductID
    ORDER BY 
        TH.TransactionID DESC
) AS CA;

O plano de execução mostra um custo estimado do operador de 0,0850383 (93%) para a busca do índice :

plano

O custo é independente do modelo de estimativa de cardinalidade em uso.

Não é uma simples adição do custo de CPU estimado e Custo Estimado I / O . Tampouco é o custo de uma execução da Busca do Índice multiplicada pelo Número Estimado de Execuções .

Como chegou esse número de custo?

Paul White 9
fonte

Respostas:

10

A lógica de derivação de custo total é complexa, mas para o caso relativamente simples da pergunta:

Entradas

  1. O número de vezes que o operador é executado.
    Este é o número estimado de execuções : 504

  2. A cardinalidade (número total de linhas) no índice
    A propriedade TableCardinality do operador Index Seek fornece isso: 113.443

  3. O número de páginas de dados no índice: 201
    Este número pode ser obtido de várias maneiras, por exemplo sys.allocation_units:

    SELECT 
        AU.data_pages
    FROM sys.allocation_units AS AU
    JOIN sys.partitions AS P
        ON P.hobt_id = AU.container_id
    WHERE
        AU.[type_desc] = N'IN_ROW_DATA'
        AND P.[object_id] = OBJECT_ID(N'Production.TransactionHistory', N'U')
        AND P.index_id = 
            INDEXPROPERTY(P.[object_id], N'IX_TransactionHistory_ProductID', 'IndexID');
  4. A densidade (1 / valores distintos ) do índice: 0,002267574
    Está disponível no vetor de densidade das estatísticas do índice:

    DBCC SHOW_STATISTICS 
    (
        N'Production.TransactionHistory', 
        N'IX_TransactionHistory_ProductID'
    ) 
    WITH DENSITY_VECTOR;

    densidade

Computação

-- Input numbers
DECLARE
    @Executions float = 504,
    @Density float = 0.002267574,
    @IndexDataPages float = 201,
    @Cardinality float = 113443;

-- SQL Server cost model constants
DECLARE
    @SeqIO float = 0.000740740740741,
    @RandomIO float = 0.003125,
    @CPUbase float = 0.000157,
    @CPUrow float = 0.0000011;

-- Computation
DECLARE
    @IndexPages float = CEILING(@IndexDataPages * @Density),
    @Rows float = @Cardinality * @Density,
    @Rebinds float = @Executions - 1e0;

DECLARE
    @CPU float = @CPUbase + (@Rows * @CPUrow),
    @IO float = @RandomIO + (@SeqIO * (@IndexPages - 1e0)),
    -- sample with replacement
    @PSWR float = @IndexDataPages * (1e0 - POWER(1e0 - (1e0 / @IndexDataPages), @Rebinds));

-- Cost components (no rewinds)
DECLARE
    @InitialCost float = @RandomIO + @CPUbase + @CPUrow,
    @RebindCPU float = @Rebinds * (1e0 * @CPUbase + @CPUrow),
    @RebindIO float = (1e0 / @Rows) * ((@PSWR - 1e0) * @IO);

-- Result
SELECT 
    OpCost = @InitialCost + @RebindCPU + @RebindIO;

db <> violino

Resultado

Paul White 9
fonte
Bom trabalho, é bom saber de onde vem o custo estimado, quais variáveis ​​o afetam e em que proporção. Esse é o mecanismo para todas as versões do SQL Server? Talvez algumas mudanças nas constantes?
EzLo
2
Este aspecto do custeio não mudou desde 2005, pelo que sei.
Paul White 9