Dica de cardinalidade do SQL Server

14

Existe uma maneira de 'injetar' uma estimativa de cardinalidade em um otimizador do SQL Server (qualquer versão)?

ou seja, algo semelhante à dica de cardinalidade do Oracle.

Minha motivação é motivada pelo artigo, Quão bom são os otimizadores de consulta, realmente? [1] , onde testam a influência do estimador de cardinalidade na seleção de um plano ruim. Portanto, seria suficiente se eu pudesse forçar o SQL Server a 'estimar' as cardinalidades precisamente para consultas complexas.


[1] Leis, Viktor, et al. "Quão bons são os otimizadores de consulta, realmente?"
Anais da doação VLDB 9.3 (2015): 204-215.

Radim Bača
fonte

Respostas:

10

Você pode obter algo semelhante à CARDINALITYdica da Oracle usando estrategicamente TOPuma função definida pelo usuário chamada MANY() desenvolvida por Adam Machanic . Vamos trabalhar com alguns exemplos. Estou usando o banco de dados AdventureWorks disponível gratuitamente. Suponha que eu realmente precise controlar o número de linhas retornadas pela thtabela derivada na seguinte consulta:

SELECT 
    p.Name
    , th.ProductId
    , th.Quantity
    , th.ActualCost
FROM Production.Product p
INNER JOIN (
    SELECT ProductId, Quantity, ActualCost
    FROM Production.TransactionHistory 
) th ON p.ProductID = th.ProductID;

Como é, recebo uma estimativa de 113443 linhas:

consulta inicial

Se precisar diminuir a estimativa th, posso usar TOPjunto com a OPTIMIZE FORdica de consulta para definir uma meta de linha. Aqui está uma maneira de fazer isso:

DECLARE @row_goal BIGINT = 9223372036854775807;
SELECT 
    p.Name
    , th.ProductId
    , th.Quantity
    , th.ActualCost
FROM Production.Product p
INNER JOIN (
    SELECT TOP (@row_goal) ProductId, Quantity, ActualCost
    FROM Production.TransactionHistory 
) th ON p.ProductID = th.ProductID
OPTION (OPTIMIZE FOR (@row_goal = 1));

Podemos ver que a estimativa é de apenas 1 linha:

Estimativa de 1 linha

Defino @row_goalo maior BIGINTvalor possível para evitar alterar os resultados. A OPTIMIZE FORdica de consulta instrui o otimizador a otimizar a consulta como se @row_goalfosse igual a 1. Vou obter os mesmos resultados, mas a consulta será otimizada de maneira diferente.

Aumentar uma estimativa de cardinalidade é mais complicado. Não podemos simplesmente aumentar o valor TOPporque o otimizador perceberá que não retornará linhas suficientes. No entanto, podemos usar a MANY()função para adicionar linhas à estimativa. Observe que a MANY()função sempre retornará 0 linhas, mas a estimativa de linha dela muda com o parâmetro de entrada. Suponha que você precise aumentar a estimativa de linha da tabela derivada em 10X. Uma maneira de conseguir isso:

SELECT 
    p.Name
    , th.ProductId
    , th.Quantity
    , th.ActualCost
FROM Production.Product p
INNER JOIN (
    SELECT TOP (9223372036854775807) ProductId, Quantity, ActualCost
    FROM Production.TransactionHistory 
    LEFT OUTER JOIN dbo.Many(10) AS m ON 1=1
) th ON p.ProductID = th.ProductID;

Podemos ver que a estimativa é 10X a tabela base:

Consulta 10X

O supérfluo TOPfoi adicionado para impedir que o otimizador movesse as tabelas. Sem ela, a MANY()função pode ser aplicada no local errado do plano.

É possível combinar as duas técnicas se você quiser uma superestimação precisa, em vez de apenas multiplicar o número de linhas por um fator. Por exemplo, suponhamos que você realmente precise que a estimativa da tabela derivada seja exatamente 1000000 linhas. Uma maneira de conseguir isso:

DECLARE @row_goal BIGINT = 9223372036854775807;

SELECT 
    p.Name
    , th.ProductId
    , th.Quantity
    , th.ActualCost
FROM Production.Product p
INNER JOIN (
    SELECT TOP (@row_goal) ProductId, Quantity, ActualCost
    FROM Production.TransactionHistory 
    LEFT OUTER JOIN dbo.Many(10) AS m ON
        1=1
) th ON p.ProductID = th.ProductID
OPTION (OPTIMIZE FOR (@row_goal = 1000000));

Podemos ver que a estimativa é de 1000000 linhas:

1 M linhas

Preciso alertar você de que essas são técnicas avançadas que geralmente não são necessárias para a otimização de consultas. Se você quiser saber mais, recomendo assistir aos Clash of the Row Goals apresentados por Adam Machanic.


função dbo.Many

-- By Adam Machanic, reproduced with permission
IF EXISTS (SELECT * FROM sys.objects WHERE name = 'Many' AND OBJECT_SCHEMA_NAME(object_id) = 'dbo')
    DROP FUNCTION dbo.Many
GO
CREATE FUNCTION dbo.Many(@n INT)
RETURNS TABLE AS
RETURN
(
    WITH
    a(x) AS
    (
        SELECT
            *
        FROM
        (
            VALUES
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1),
                (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1), (1)
        ) AS x0(x)
    )
    SELECT TOP(@n)
        1 AS x
    FROM
        a AS a1,
        a AS a2
    WHERE
        a1.x % 2 = 0
)
GO
Joe Obbish
fonte
9

Não há como injetar uma estimativa de cardinalidade diretamente no otimizador, mas dependendo do que você deseja obter, existem algumas opções.

Você pode usar uma OPTION (FAST N)dica de consulta para introduzir metas de linha e possivelmente reescrever sua consulta usando CTEs ou subconsultas para injetar TOP...ORDER BYmetas de linha baseadas em diferentes partes do seu plano de execução, mas não tenho certeza de quão eficiente será sua consulta resultante quando você iniciar brincando com as construções mais complexas.

Consulte Por dentro do otimizador: metas de linha em profundidade para obter uma explicação mais completa.

Se você deseja influenciar os operadores escolhidos pelo otimizador, não precisa injetar estimativas de cardinalidade, mas pode usar coisas como OPTION (MERGE JOIN)ou OPTION (HASH JOIN)por exemplo para forçar os operadores de junção física.

Este artigo entra em mais detalhes sobre como influenciar um plano usando dicas: Controlando planos de execução com dicas

Se você deseja fixar um plano, também pode usar um guia de plano.

Novamente, não está claro qual é o seu caso de uso real e sua milhagem pode variar usando essas técnicas. Em muitos casos, é melhor deixar o otimizador decidir e ter estatísticas atualizadas para que ele possa tomar uma decisão informada.


Sugestão relevante do Microsoft Connect: permita especificar uma dica de seletividade de filtro nas consultas por xor88. A Microsoft respondeu:

Obrigado pelo feedback. Eu posso ver o benefício potencial disso. Em geral, nos esforçamos para tornar o nosso comportamento automático o melhor possível e evitar a necessidade desse tipo de dica, mas é claro que temos muitas outras dicas. Consideraremos isso para uma versão futura, mas estaria além da versão Denali (11.0).

Atenciosamente,
Eric Hanson
Gerente de Programa
Processamento de Consultas do SQL Server

Tom V - tente topanswers.xyz
fonte
3

Você pode usar a OPTIMIZE FORdica de consulta do SQL Server para coagir a estimativa de cardinalidade com base em valores sugeridos em vez de usar o valor real (parâmetros) ou o valor desconhecido (variáveis) durante a compilação. Consulte o tópico Dicas de consulta na documentação do SQL Server para obter detalhes completos.

Por exemplo, a consulta abaixo estimará as contagens de linhas com base no histograma de estatísticas a partir de valores sugeridos, em vez da cardinalidade média geral, como faria com variáveis ​​locais.

DECLARE 
      @StartDate datetime = '20150101'
    , @EndDate datetime = '20150102';
SELECT *
FROM dbo.Example
WHERE
    DateColumn BETWEEN  @StartDate AND @EndDate
OPTION(OPTIMIZE FOR(@StartDate = '20100101', @EndDate='20100101'));

Da mesma forma, a dica pode ser usada para parâmetros, para que as estimativas sejam baseadas no histograma de estatísticas a partir de valores sugeridos em vez de valores reais de parâmetros durante a compilação.

DECLARE 
      @StartDate datetime = '20150101'
    , @EndDate datetime = '20150102';
EXECUTE sp_executesql N'SELECT *
        FROM dbo.Example
        WHERE
            DateColumn BETWEEN  @StartDate AND @EndDate
        OPTION(OPTIMIZE FOR(@StartDate = ''20100101'', @EndDate=''20100101''));'
    , N'@StartDate datetime, @EndDate datetime'
    , @StartDate = @StartDate
    , @EndDate = @EndDate;

A UNKNOWNpalavra-chave pode ser especificada em vez de um literal na dica para usar a cardinalidade média geral em vez de estimar com base no valor real do parâmetro e no histograma de estatísticas.

Dan Guzman
fonte