Eu estava tentando responder à seguinte pergunta do stackoverflow:
Depois de postar uma resposta um tanto ingênua, achei que colocaria meu dinheiro onde estava minha boca e realmente testaria o cenário que estava sugerindo, para ter certeza de que não estava enviando o OP em uma louca perseguição. Bem, acabou sendo muito mais difícil do que eu pensava (não há surpresa para ninguém, tenho certeza).
Aqui está o que eu tentei e pensei:
Primeiro, tentei um TOP 1 UPDATE com ORDER BY dentro de uma tabela derivada, usando
ROWLOCK, READPAST
. Isso gerou impasses e também processou itens fora de ordem. Ele deve estar o mais próximo possível do FIFO, impedindo erros que exijam a tentativa de processar a mesma linha mais de uma vez.Então eu tentei selecionar o próximo QueueID desejado em uma variável, utilizando várias combinações de
READPAST
,UPDLOCK
,HOLDLOCK
, eROWLOCK
para preservar exclusivamente a linha para atualização por essa sessão. Todas as variações que experimentei sofreram dos mesmos problemas de antes e, em certas combinaçõesREADPAST
, com queixas:Você pode especificar apenas o bloqueio READPAST nos níveis de isolamento READ COMMITTED ou REPEATABLE READ.
Isso foi confuso porque foi LIDO COMPROMISSO. Já deparei com isso antes e é frustrante.
Desde que comecei a escrever essa pergunta, Remus Rusani postou uma nova resposta para a pergunta. Li seu artigo vinculado e vi que ele estava usando leituras destrutivas, pois ele disse em sua resposta que "não é realisticamente possível manter travas durante a duração das chamadas pela web". Depois de ler o que o artigo dele diz sobre pontos de acesso e páginas que exigem bloqueio para fazer qualquer atualização ou exclusão, eu temo que, mesmo que eu fosse capaz de descobrir os bloqueios corretos para fazer o que estou procurando, ele não seria escalável e poderia não lide com simultaneidade maciça.
No momento, não tenho certeza para onde ir. É verdade que a manutenção de bloqueios enquanto a linha é processada não pode ser alcançada (mesmo que não tenha suporte a altos tps ou simultaneidade maciça)? o que estou perdendo?
Na esperança de que pessoas mais inteligentes que eu e pessoas mais experientes que eu possam ajudar, abaixo está o script de teste que eu estava usando. Ele voltou ao método TOP 1 UPDATE, mas deixei o outro método, comentei, caso você queira explorar isso também.
Cole cada um deles em uma sessão separada, execute a sessão 1 e rapidamente todos os outros. Em cerca de 50 segundos, o teste terminará. Veja as Mensagens de cada sessão para ver o que ele fez (ou como falhou). A primeira sessão mostrará um conjunto de linhas com um instantâneo tirado uma vez por segundo detalhando os bloqueios presentes e os itens da fila em processamento. Às vezes funciona e outras não.
Sessão 1
/* Session 1: Setup and control - Run this session first, then immediately run all other sessions */
IF Object_ID('dbo.Queue', 'U') IS NULL
CREATE TABLE dbo.Queue (
QueueID int identity(1,1) NOT NULL,
StatusID int NOT NULL,
QueuedDate datetime CONSTRAINT DF_Queue_QueuedDate DEFAULT (GetDate()),
CONSTRAINT PK_Queue PRIMARY KEY CLUSTERED (QueuedDate, QueueID)
);
IF Object_ID('dbo.QueueHistory', 'U') IS NULL
CREATE TABLE dbo.QueueHistory (
HistoryDate datetime NOT NULL,
QueueID int NOT NULL
);
IF Object_ID('dbo.LockHistory', 'U') IS NULL
CREATE TABLE dbo.LockHistory (
HistoryDate datetime NOT NULL,
ResourceType varchar(100),
RequestMode varchar(100),
RequestStatus varchar(100),
ResourceDescription varchar(200),
ResourceAssociatedEntityID varchar(200)
);
IF Object_ID('dbo.StartTime', 'U') IS NULL
CREATE TABLE dbo.StartTime (
StartTime datetime NOT NULL
);
SET NOCOUNT ON;
IF (SELECT Count(*) FROM dbo.Queue) < 10000 BEGIN
TRUNCATE TABLE dbo.Queue;
WITH A (N) AS (SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1),
B (N) AS (SELECT 1 FROM A Z, A I, A P),
C (N) AS (SELECT Row_Number() OVER (ORDER BY (SELECT 1)) FROM B O, B W)
INSERT dbo.Queue (StatusID, QueuedDate)
SELECT 1, DateAdd(millisecond, C.N * 3, GetDate() - '00:05:00')
FROM C
WHERE C.N <= 10000;
END;
TRUNCATE TABLE dbo.StartTime;
INSERT dbo.StartTime SELECT GetDate() + '00:00:15'; -- or however long it takes you to go run the other sessions
GO
TRUNCATE TABLE dbo.QueueHistory;
SET NOCOUNT ON;
DECLARE
@Time varchar(8),
@Now datetime;
SELECT @Time = Convert(varchar(8), StartTime, 114)
FROM dbo.StartTime;
WAITFOR TIME @Time;
DECLARE @i int,
@QueueID int;
SET @i = 1;
WHILE @i <= 33 BEGIN
SET @Now = GetDate();
INSERT dbo.QueueHistory
SELECT
@Now,
QueueID
FROM
dbo.Queue Q WITH (NOLOCK)
WHERE
Q.StatusID <> 1;
INSERT dbo.LockHistory
SELECT
@Now,
L.resource_type,
L.request_mode,
L.request_status,
L.resource_description,
L.resource_associated_entity_id
FROM
sys.dm_tran_current_transaction T
INNER JOIN sys.dm_tran_locks L
ON L.request_owner_id = T.transaction_id;
WAITFOR DELAY '00:00:01';
SET @i = @i + 1;
END;
WITH Cols AS (
SELECT *, Row_Number() OVER (PARTITION BY HistoryDate ORDER BY QueueID) Col
FROM dbo.QueueHistory
), P AS (
SELECT *
FROM
Cols
PIVOT (Max(QueueID) FOR Col IN ([1], [2], [3], [4], [5], [6], [7], [8])) P
)
SELECT L.*, P.[1], P.[2], P.[3], P.[4], P.[5], P.[6], P.[7], P.[8]
FROM
dbo.LockHistory L
FULL JOIN P
ON L.HistoryDate = P.HistoryDate
/* Clean up afterward
DROP TABLE dbo.StartTime;
DROP TABLE dbo.LockHistory;
DROP TABLE dbo.QueueHistory;
DROP TABLE dbo.Queue;
*/
Sessão 2
/* Session 2: Simulate an application instance holding a row locked for a long period, and eventually abandoning it. */
SET TRANSACTION ISOLATION LEVEL READ COMMITTED;
SET NOCOUNT ON;
SET XACT_ABORT ON;
DECLARE
@QueueID int,
@Time varchar(8);
SELECT @Time = Convert(varchar(8), StartTime + '0:00:01', 114)
FROM dbo.StartTime;
WAITFOR TIME @Time;
BEGIN TRAN;
--SET @QueueID = (
-- SELECT TOP 1 QueueID
-- FROM dbo.Queue WITH (READPAST, UPDLOCK)
-- WHERE StatusID = 1 -- ready
-- ORDER BY QueuedDate, QueueID
--);
--UPDATE dbo.Queue
--SET StatusID = 2 -- in process
----OUTPUT Inserted.*
--WHERE QueueID = @QueueID;
SET @QueueID = NULL;
UPDATE Q
SET Q.StatusID = 1, @QueueID = Q.QueueID
FROM (
SELECT TOP 1 *
FROM dbo.Queue WITH (ROWLOCK, READPAST)
WHERE StatusID = 1
ORDER BY QueuedDate, QueueID
) Q
PRINT @QueueID;
WAITFOR DELAY '00:00:20'; -- Release it partway through the test
ROLLBACK TRAN; -- Simulate client disconnecting
Sessão 3
/* Session 3: Run a near-continuous series of "failed" queue processing. */
SET TRANSACTION ISOLATION LEVEL READ COMMITTED;
SET XACT_ABORT ON;
SET NOCOUNT ON;
DECLARE
@QueueID int,
@EndDate datetime,
@NextDate datetime,
@Time varchar(8);
SELECT
@EndDate = StartTime + '0:00:33',
@Time = Convert(varchar(8), StartTime, 114)
FROM dbo.StartTime;
WAITFOR TIME @Time;
WHILE GetDate() < @EndDate BEGIN
BEGIN TRAN;
--SET @QueueID = (
-- SELECT TOP 1 QueueID
-- FROM dbo.Queue WITH (READPAST, UPDLOCK)
-- WHERE StatusID = 1 -- ready
-- ORDER BY QueuedDate, QueueID
--);
--UPDATE dbo.Queue
--SET StatusID = 2 -- in process
----OUTPUT Inserted.*
--WHERE QueueID = @QueueID;
SET @QueueID = NULL;
UPDATE Q
SET Q.StatusID = 1, @QueueID = Q.QueueID
FROM (
SELECT TOP 1 *
FROM dbo.Queue WITH (ROWLOCK, READPAST)
WHERE StatusID = 1
ORDER BY QueuedDate, QueueID
) Q
PRINT @QueueID;
SET @NextDate = GetDate() + '00:00:00.015';
WHILE GetDate() < @NextDate SET NOCOUNT ON;
ROLLBACK TRAN;
END
Sessão 4 e superior - quantas você quiser
/* Session 4: "Process" the queue normally, one every second for 30 seconds. */
SET TRANSACTION ISOLATION LEVEL READ COMMITTED;
SET XACT_ABORT ON;
SET NOCOUNT ON;
DECLARE @Time varchar(8);
SELECT @Time = Convert(varchar(8), StartTime, 114)
FROM dbo.StartTime;
WAITFOR TIME @Time;
DECLARE @i int,
@QueueID int;
SET @i = 1;
WHILE @i <= 30 BEGIN
BEGIN TRAN;
--SET @QueueID = (
-- SELECT TOP 1 QueueID
-- FROM dbo.Queue WITH (READPAST, UPDLOCK)
-- WHERE StatusID = 1 -- ready
-- ORDER BY QueuedDate, QueueID
--);
--UPDATE dbo.Queue
--SET StatusID = 2 -- in process
--WHERE QueueID = @QueueID;
SET @QueueID = NULL;
UPDATE Q
SET Q.StatusID = 1, @QueueID = Q.QueueID
FROM (
SELECT TOP 1 *
FROM dbo.Queue WITH (ROWLOCK, READPAST)
WHERE StatusID = 1
ORDER BY QueuedDate, QueueID
) Q
PRINT @QueueID;
WAITFOR DELAY '00:00:01'
SET @i = @i + 1;
DELETE dbo.Queue
WHERE QueueID = @QueueID;
COMMIT TRAN;
END
fonte
READPAST, UPDLOCK, ROWLOCK
desvantagem interessante é que, com meu script para capturar dados na tabela QueueHistory, não está fazendo nada. Gostaria de saber se é porque o StatusID não está comprometido? Está usandoWITH (NOLOCK)
tão teoricamente deve funcionar ... e funcionou antes! Não sei por que não está funcionando agora, mas provavelmente é outra experiência de aprendizado.Respostas:
Você precisa exatamente de 3 dicas de bloqueio
Eu respondi isso anteriormente no SO: /programming/939831/sql-server-process-queue-race-condition/940001#940001
Como Remus diz, usar o service broker é mais agradável, mas essas dicas funcionam
Seu erro sobre o nível de isolamento geralmente significa replicação ou NOLOCK está envolvido.
fonte
UPDATE SET ... FROM (SELECT TOP 1 ... FROM ... ORDER BY ...)
) Isso significa que meu padrão UPDATE segurando uma trava não pode funcionar? Além disso, no momento em que você combinaREADPAST
comHOLDLOCK
você, obtém o erro. Não há replicação neste servidor e o nível de isolamento é READ COMMITTED.StatusID
para desenfileirar um item. Isso está correto? 2. Seu pedido de desenfileiramento deve ser inequívoco. Se você estiver enfileirando itensGETDATE()
, em volumes altos, é muito provável que vários itens sejam igualmente elegíveis para desenfileirar ao mesmo tempo. Isso levará a impasses. Sugiro adicionar umIDENTITY
ao índice clusterizado para garantir uma ordem de remoção da fila inequívoca.O servidor SQL funciona muito bem para armazenar dados relacionais. Quanto a uma fila de empregos, não é tão boa. Veja este artigo escrito para o MySQL, mas também pode ser aplicado aqui. https://blog.engineyard.com/2011/5-subtle-ways-youre-using-mysql-as-a-queue-and-why-itll-bite-you
fonte
emails
tabela e nanew_emails
fila. O processamento controla anew_emails
fila e atualiza o estado naemails
tabela . Isso também evita o problema do estado "gordo" que viaja em filas. Se falarmos sobre processamento distribuído e filas verdadeiras , com comunicação (por exemplo, SSB), as coisas ficam mais complicadas, pois o estado compartilhado é problemático em sistemas com restrições.