Falha no backup do SQL Server. Erro: 3041, Gravidade: 16, Estado: 1

11

Primeiro de tudo, eu sou muito novo na stackexchange, então por favor, tenha paciência comigo.

Estou executando um SQL Server 9.0.4060.

Meu problema é: meu backup do SQL Server continua falhando em muitos bancos de dados.

O plano de manutenção é executado em diferentes tarefas de backup:

Backup DIFF todos os dias às 20:30 e backup COMPLETO todos os domingos às 20:30.

Eu recebo esses dois erros para cada banco de dados que falha ao concluir o backup:

Date        06-11-2012 20:31:06
Log     SQL Server (Current - 07-11-2012 11:43:00)
Source      Backup
Message
BACKUP failed to complete the command BACKUP DATABASE (dbname) WITH DIFFERENTIAL. Check the backup application log for detailed messages.

Date        06-11-2012 20:31:06
Log     SQL Server (Current - 07-11-2012 11:43:00)
Source      Backup
Message
Error: 3041, Severity: 16, State: 1.

Erros extras.

Date     06-11-2012 17:53:27 
Log      SQL Server (Current - 07-11-2012 11:43:00) 
Source   Logon 
Message  Error: 18456, Severity: 14, State: 16.

Date     06-11-2012 17:53:27 
Log      SQL Server (Current - 07-11-2012 11:43:00) 
Source   Logon 
Message  Login failed for user 'sa'. [CLIENT: <local machine>]

Date     06-11-2012 20:30:11
Log      SQL Server (Current - 09-11-2012 11:27:00)
Source   spid15s
Message
SQL Server has encountered 2 occurrence(s) of cachestore flush for the 'Bound Trees' cachestore (part of plan cache) due to some database maintenance or reconfigure operations.

Existem outros erros semelhantes ao anterior, com 'SQL Plans' e 'Object Plans'. Em vez de 'Bound Trees'.

Se você precisar de outras informações, diga a palavra.

Arviddk
fonte
Existem erros anteriores ao 3041 no log de erros do servidor sql? (não o registro de windows)
Alex K.
Sim, existem esses dois erros: "Data 06-11-2012 17:53:27 Log SQL Server (Atual - 07-11-2012 11:43:00) Erro de mensagem de logon de origem: 18456, Gravidade: 14, Estado: 16. "" Data 06-11-2012 17:53:27 Log do SQL Server (atual - 11/11/2012 11:43:00) Mensagem de logon de origem Falha no logon do usuário 'sa'. [CLIENTE: <máquina local> ] "
existem mais erros do que isso?
swasheck
Sim @swasheck, adicionei mais alguns erros na descrição
Arviddk
são backups nativos ou você está usando outro software de backup?
swasheck

Respostas:

4

Como Max apontou, o erro de login sa não corresponde ao tempo de backup, como acontece várias horas antes, mas o segundo ocorre. Você já viu: http://blogs.msdn.com/b/sqlprogrammability/archive/2007/01/17/10-0-plan-cache-flush.aspx

http://www.sqlservercentral.com/Forums/Topic377116-146-1.aspx#bm380502

Algum dos itens do blog do MSDN desempenha um fator importante no seu ambiente? O mais comum seria o AUTO_CLOSE ON. Deixe-nos saber, obrigado.

Ali Razeghi
fonte
AUTO_CLOSE está ativado em 10 dos 164 DBs. Contei 70 ocorrências de 'Bound Trees', 'SQL Plans' e 'Object Plans' em 13/11/2012 21:45:24. Em 13/11/2012 21:53:15, foi redefinido para 1 ocorrência de cada. Espero que isto ajude.
Arviddk
Isso ajuda a identificar o erro @ SQL-Learner? Perguntei aos outros giros em TI do meu departamento se eles sabiam se algum dos outros comandos mencionados no blog do MSDN.
Arviddk
Oi Arviddk, deixe-me olhar mais para ele hoje! Obrigado.
Ali Razeghi
Ok, aguardamos a sua resposta!
Arviddk
2

Por favor, dê uma olhada aqui: Como solucionar problemas de "Msg 3041" no SQL Server

Trecho da página:

A mensagem 3041 é um relatório genérico sobre a falha no backup. Para entender a causa do erro e resolvê-lo, você deve usar as entradas de log de erro do SQL Server que ocorrem antes da entrada do evento 3041. Normalmente, 3041 é precedido por uma mensagem de erro detalhada que indica o verdadeiro motivo da falha no backup. As mensagens de erro detalhadas são gravadas apenas no log de erros do SQL Server e no aplicativo cliente. A mensagem detalhada não é relatada no log do aplicativo no Windows.

Atualização (Depois de ler o comentário do @dezso)
, vi o "erro extra" relatado, mas não tenho certeza de que eles estejam relacionados ao erro de backup. O erro de backup é datado às 20:31:06, mas o "erro extra" é datado às 17:53:27, portanto, o erro extra ocorreu cerca de 2 horas e 40 minutos antes do erro de backup real. E esses erros extras estão relacionados a um problema de logon.

Eu não acho que um problema de logon ocorrendo às 17:53:27 possa resultar em falha no backup às 20:31:06. Então, pense que o erro de backup e o "erro extra" não estão relacionados.

Também não acho que um erro genérico que ocorra às 17:53:27 possa resultar na falha do backup às 20:31:06 (a menos que o banco de dados seja realmente grande). O @Arviddk informa que "meu backup do SQL Server continua falhando em muitos bancos de dados ". Acho seguro assumir que "muito" significa mais do que 10 DB.
Portanto, acho que se um único backup de um único banco de dados demorar mais de 2 horas e 40 minutos, você não poderá ter 10 ou 20 bancos de dados como esse em um único servidor ... ou o servidor passará a vida fazendo apenas backup. Por isso, presumi que o backup único levasse muito menos de 2 horas e 40 minutos, então acho que o erro de backup e o erro extra não estão relacionados.

E o último erro "cacheestore flush / 'Bound Trees'" relatado é datado de 06-11-2012 20:30:11; portanto, ocorreu algo após o erro de backup. De qualquer forma, um problema relacionado ao cache não deve resultar em um erro (evento se ele puder abrandar alguma coisa).

Algumas perguntas
Algumas perguntas que podem ajudar a identificar o problema:

  • Quanto tempo leva para executar um backup COMPLETO?
  • Quanto tempo leva para executar um backup DIFF?
  • O erro ocorre apenas no backup DIFF?
  • Qual porcentagem de backup falha? (1% a 10% a 50%)
  • Talvez você possa tentar fazer backup COMPLETO apenas para verificar se há algum problema relacionado ao backup DIFF. (Eu nunca fiz nenhum backup DIFF no SQL Server, não tenho experiência com eles)

De acordo com o site da Microsoft no log do SQL Server, deve haver outros erros relacionados ao backup com falha, mas estou esperando algo mais próximo, com o tempo, do horário em que o backup está falhando.

Máx.
fonte
O OP já incluiu mensagens de erro anteriores a 3041 - você acha que ainda não é suficiente? Se sim, modifique sua postagem de acordo.
Dezso
O backup falha para DIFF e CHEIO. Leva em média cerca de 2-3 minutos para o backup terminar. (O último erro é registrado 2-3 minutos após o início do backup). Contei 100 desses erros no backup DIFF de 13/11/2012 - "Falha no backup ao concluir o comando BACKUP DATABASE (dbname) COM DIFERENCIAL ....." "
Arviddk
@ Arviddk você fala sobre 164 DB's, mas esses são todos em um único servidor? Como estão agendados os backups do banco de dados? Talvez o erro que você vê possa estar relacionado a algum tipo de backup agendado sobreposto? (Não sei se a execução simultânea de 2 ou mais backups T-Sql pode criar erros ... nunca tentei) Se os backups estiverem sobrepostos com o tempo, talvez seja possível forçá-los a executar 1 por 1 em série maneira? (No meu servidor Eu tenho um único script que backup de todo o meu DB, para que não haja sobreposição de execução de backup)
Max
Sim, existem 164 DBs no servidor. Mas 99 deles estão offline. A função 'Auto_close' está ativada em alguns dos bancos de dados, para que eles fechem sempre que não estiverem em uso. (tanto quanto eu entendo?)
Arviddk