Estamos tentando atualizar / excluir um grande número de registros em uma tabela de bilhões de linhas. Como essa é uma tabela popular, há muita atividade em diferentes seções desta tabela. Qualquer atividade grande de atualização / exclusão está sendo bloqueada por longos períodos de tempo (enquanto aguarda para obter bloqueios em todas as linhas ou bloqueio de página ou bloqueio de tabela), resultando em tempos limite ou em vários dias para concluir a tarefa.
Portanto, estamos mudando a abordagem para excluir um pequeno lote de linhas de cada vez. Mas queremos verificar se os selecionados (digamos 100 ou 1000 ou 2000 linhas) estão atualmente bloqueados por um processo diferente ou não.
- Caso contrário, continue com a exclusão / atualização.
- Se eles estiverem bloqueados, passe para o próximo grupo de registros.
- No final, volte ao início e tente atualizar / excluir os excluídos.
Isso é factível?
Obrigado, ToC
Respostas:
Se eu entendi a solicitação corretamente, o objetivo é excluir lotes de linhas, enquanto, ao mesmo tempo, operações DML estão ocorrendo nas linhas da tabela. O objetivo é excluir um lote; no entanto, se alguma linha subjacente contida no intervalo definido pelo referido lote estiver bloqueada, devemos pular esse lote e passar para o próximo lote. Devemos então retornar a qualquer lote que não tenha sido excluído anteriormente e tentar novamente nossa lógica de exclusão original. Devemos repetir esse ciclo até que todos os lotes necessários de linhas sejam excluídos.
Como foi mencionado, é razoável usar uma dica READPAST e o nível de isolamento READ COMMITTED (padrão), para ignorar os intervalos anteriores que podem conter linhas bloqueadas. Vou dar um passo adiante e recomendo o uso do nível de isolamento SERIALIZABLE e exclusões de mordiscar.
O SQL Server usa bloqueios de intervalo de chave para proteger um intervalo de linhas implicitamente incluídas em um conjunto de registros que está sendo lido por uma instrução Transact-SQL ao usar o nível de isolamento de transação serializável ... saiba mais aqui: https://technet.microsoft.com /en-US/library/ms191272(v=SQL.105).aspx
Com exclusões de mordiscar, nosso objetivo é isolar um intervalo de linhas e garantir que nenhuma alteração ocorra nessas linhas enquanto as excluirmos, ou seja, não queremos leituras ou inserções fantasmas. O nível de isolamento serializável visa solucionar esse problema.
Antes de demonstrar minha solução, gostaria de acrescentar que não estou recomendando mudar o nível de isolamento padrão do seu banco de dados para SERIALIZABLE nem estou recomendando que minha solução seja a melhor. Eu apenas desejo apresentá-lo e ver para onde podemos ir daqui.
Algumas notas de manutenção:
Para iniciar meu experimento, configurarei um banco de dados de teste, uma tabela de amostra e preencherei a tabela com 2.000.000 de linhas.
Nesse ponto, precisaremos de um ou mais índices nos quais os mecanismos de bloqueio do nível de isolamento SERIALIZABLE possam atuar.
Agora, vamos verificar se nossas 2.000.000 de linhas foram criadas
Portanto, temos nosso banco de dados, tabela, índices e linhas. Então, vamos configurar o experimento para excluir petiscos. Primeiro, devemos decidir qual a melhor maneira de criar um mecanismo típico de exclusão.
Como você pode ver, coloquei a transação explícita dentro do loop while. Se você deseja limitar as liberações de log, sinta-se à vontade para colocá-lo fora do loop. Além disso, como estamos no modelo de recuperação COMPLETO, convém criar backups de log de transações com mais frequência ao executar suas operações de exclusão, a fim de garantir que seu log de transações possa ser impedido de crescer escandalosamente.
Então, eu tenho alguns objetivos com essa configuração. Primeiro, quero meus bloqueios no intervalo de teclas; então, tento manter os lotes o menor possível. Eu também não quero impactar negativamente a concorrência na minha mesa "gigantesca"; então, quero pegar meus bloqueios e deixá-los o mais rápido possível. Portanto, recomendo que você diminua o tamanho do lote.
Agora, quero fornecer um exemplo muito curto dessa rotina de exclusão em ação. Devemos abrir uma nova janela no SSMS e excluir uma linha da nossa tabela. Farei isso dentro de uma transação implícita usando o nível de isolamento READ COMMITTED padrão.
Esta linha foi realmente excluída?
Sim, foi excluído.
Agora, para ver nossos bloqueios, vamos abrir uma nova janela no SSMS e adicionar um trecho de código ou dois. Estou usando o sp_whoisactive do Adam Mechanic, que pode ser encontrado aqui: sp_whoisactive
Agora, estamos prontos para começar. Em uma nova janela do SSMS, vamos começar uma transação explícita que tentará reinserir a linha que excluímos. Ao mesmo tempo, iniciaremos nossa operação de exclusão mordisada.
O código de inserção:
Vamos iniciar as duas operações começando com a inserção e seguidas pelas nossas exclusões. Podemos ver os bloqueios de faixa de chave e bloqueios exclusivos.
A inserção gerou esses bloqueios:
A exclusão / seleção mordisca está mantendo estes bloqueios:
Nossa inserção está bloqueando nossa exclusão conforme o esperado:
Agora, vamos confirmar a transação de inserção e ver o que está acontecendo.
E, como esperado, todas as transações são concluídas. Agora, devemos verificar se a inserção era um fantasma ou se a operação de exclusão também a removeu.
De fato, a inserção foi excluída; portanto, nenhuma inserção fantasma foi permitida.
Portanto, concluindo, acho que a verdadeira intenção deste exercício não é tentar rastrear todas as linhas, páginas ou bloqueios em nível de tabela e tentar determinar se um elemento de um lote está bloqueado e, portanto, exigiria que nossa operação de exclusão fosse executada. esperar. Essa pode ter sido a intenção dos questionadores; no entanto, essa tarefa é hercúlea e basicamente impraticável, se não impossível. O objetivo real é garantir que nenhum fenômeno indesejado ocorra depois que isolarmos o intervalo do nosso lote com bloqueios próprios e, em seguida, precedermos a exclusão do lote. O nível de isolamento SERIALIZABLE atinge esse objetivo. A chave é manter pequenos petiscos, controlar o log de transações e eliminar fenômenos indesejados.
Se você deseja velocidade, não crie tabelas gigantes profundas que não possam ser particionadas e, portanto, não consiga usar a alternância de partições para obter os resultados mais rápidos. A chave da velocidade é particionamento e paralelismo; a chave do sofrimento é mordiscar e travar a vida.
Por favor, deixe-me saber o que você pensa.
Criei mais alguns exemplos do nível de isolamento SERIALIZABLE em ação. Eles devem estar disponíveis nos links abaixo.
Excluir operação
Inserir operação
Operações de igualdade - bloqueios de intervalo de chave nos próximos valores-chave
Operações de Igualdade - Busca Singleton de Dados Existentes
Operações de igualdade - busca singleton de dados inexistentes
Operações de desigualdade - bloqueios de intervalo de chave no intervalo e nos próximos valores-chave
fonte
É realmente uma boa idéia excluir em pequenos lotes ou pedaços cuidadosos . Eu adicionaria um pequeno
waitfor delay '00:00:05'
e, dependendo do modelo de recuperação do banco de dados - seFULL
, faça umlog backup
e seSIMPLE
fizer ummanual CHECKPOINT
para evitar inchaço no log de transações - entre lotes.O que você está dizendo não é totalmente possível fora da caixa (tendo em mente seus três pontos). Se a sugestão acima -
small batches + waitfor delay
não funcionar (desde que você faça o teste adequado), poderá usar oquery HINT
.Não use
NOLOCK
- consulte kb / 308886 , Problemas de consistência de leitura do SQL Server por Itzik Ben-Gan , colocando o NOLOCK em toda parte - Por Aaron Bertrand e NOLOCK Hint do SQL Server e outras idéias ruins .READPAST
dica vai ajudar no seu cenário. A essência daREADPAST
dica é - se houver um bloqueio no nível da linha, o SQL Server não o lerá.Durante meus testes limitados, achei uma taxa de transferência realmente boa ao usar
DELETE from schema.tableName with (READPAST, READCOMMITTEDLOCK)
e definir o nível de isolamento da sessão de consulta paraREAD COMMITTED
usarSET TRANSACTION ISOLATION LEVEL READ COMMITTED
qual é o nível de isolamento padrão de qualquer maneira.fonte
Resumindo outras abordagens originalmente oferecidas nos comentários à pergunta.
Use
NOWAIT
se o comportamento desejado falhar em todo o bloco assim que um bloqueio incompatível for encontrado.A partir da
NOWAIT
documentação :Use
SET LOCK_TIMEOUT
para obter um resultado semelhante, mas com um tempo limite configurável:A partir da
SET LOCK_TIMEOUT
documentaçãofonte
Para assumir que temos duas consultas paralelas:
conectar / sessão 1: bloqueará a linha = 777
connect / session 2: ignorará a linha bloqueada = 777
OU conectar / sessão 2: lançará uma exceção
fonte
Tente filtrar algo assim - pode ficar complicado se você quiser ser realmente, realmente específico. Procure na BOL a descrição de sys.dm_tran_locks
fonte
Você pode usar o NoLOCK enquanto estiver excluindo e, se as linhas estiverem bloqueadas, elas não serão excluídas. Não é o ideal, mas pode fazer o truque para você.
fonte
Msg 1065, Level 15, State 1, Line 15 The NOLOCK and READUNCOMMITTED lock hints are not allowed for target tables of INSERT, UPDATE, DELETE or MERGE statements.
, ficar obsoleto desde 2005