Preciso executar uma verificação nos backups de fita LTO, mesmo que as próprias unidades realizem a verificação enquanto gravam?

8

Temos uma unidade de fita LTO-3 em uma biblioteca de mídia da Dell que usamos para nossos backups em fita. O artigo sobre LTO na Wikipedia afirma que:

O LTO usa uma tecnologia automática de verificação após gravação para verificar imediatamente os dados enquanto eles estão sendo gravados, mas alguns sistemas de backup explicitamente executam uma operação de leitura de fita completamente separada para verificar se a fita foi gravada corretamente. Essa operação de verificação separada dobra o número de passes de ponta a ponta para cada backup agendado e reduz a vida da fita pela metade.

O que eu gostaria de saber é: preciso do meu software de backup (neste caso, o Backup Exec) para executar uma verificação nessas fitas ou a tecnologia de verificação após gravação inerente às unidades LTO é suficiente?

Eu também ficaria curioso se o Backup Exec entender a tecnologia de verificação após gravação o suficiente para me alertar se essa tecnologia não poderia justificar os dados ou simplesmente a ignorará, tornando-os inúteis de qualquer maneira, pois mesmo que a unidade detecte um problema, eu nunca saber sobre isso.

Chris Magnuson
fonte

Respostas:

10

Ótima pergunta!

Enquanto eu diria que sim, você deve testá-los, eu diria que testar as fitas / unidades em si é importante, o que é muito mais vital é testar o processo de restauração de ponta a ponta .

Não posso recomendar restaurações regulares regulares suficientes do sistema e testes de serviço, é a única maneira de saber com certeza que todo o sistema está fazendo o que você comprou. Você não precisa procurar muito neste site para ver pessoas que lutam para restaurar seus serviços, mesmo que pensassem ter coberto todas as etapas individualmente.

Espero que isto ajude.

Chopper3
fonte
1
+1 para restauração. É neste ponto que eu gritei com "máquinas virtuais!" - restaurando para uma máquina virtual pode ser um bom indicador sem interrupções que o backup é útil
Sirex
1
O que você está dizendo é definitivamente uma boa idéia e devemos começar a fazê-lo, mas ainda não tenho certeza se a tecnologia de verificação na gravação nas unidades LTO 3 causará falha no meu backup se, por algum motivo, os dados não puderem ser verificados da mesma forma que faria ocorrer se meu software de backup executou uma verificação nos dados. Gosto da ideia de fazer algo mais, mas ainda preciso saber se atualmente estou fazendo algo redundante que não é necessário. Obrigado
Chris Magnuson
1
Além disso, certifique-se de fazer uma restauração usando uma unidade de fita diferente da que o backup foi feito, pois algumas fitas só podem ser lidas na unidade que as criou (ou pelo menos isso foi possível no passado).
James
@ChrisMagnuson Você já descobriu o que acontece se a unidade detectar um erro usando seu próprio esquema de verificação após gravação?
precisa saber é
1
@ alx9r Receio que não. Parece que ninguém sabe ao certo e não tenho certeza de como você pode danificar intencionalmente os dados imediatamente após serem gravados pelo cabeçote da fita, mas antes de serem lidos por qualquer mecanismo que faça a verificação após gravação para que você possa ver como o seu software de backup responde à detecção de um erro.
22814 Chris Magnuson
1

Antes de tudo, essa verificação automática não substitui a verificação completa. Vi unidades enviadas com um bug de firmware que fazia com que a leitura de restauração fosse menos confiável que a leitura de verificação.

O resultado disso foi que você poderia escrever as fitas sem que nenhum erro fosse relatado, mas, ao tentar restaurar, você veria as leituras obtendo erros ou diminuindo a velocidade em várias ordens de magnitude.

A maioria dos clientes nunca notou esse bug de firmware. De acordo com o fornecedor, porque os clientes não realizaram restaurações de teste. Este bug em particular foi corrigido. Mas tenho certeza de que não vimos o último bug do firmware, e alguns bugs do firmware só serão descobertos se você realmente testar leituras reais.

O que acontece quando a verificação falha é que o firmware grava automaticamente uma segunda cópia (e durante a restauração transparente do firmware para o host retorna apenas uma das duas cópias). Isso significa que a capacidade disponível varia dependendo da saúde da unidade e da qualidade da mídia.

Se muitas tentativas de gravação falharem na verificação, um erro será relatado novamente no nível SCSI. Alguém poderia pensar que um erro relatado dessa maneira é difícil de perder na camada de software, mas os bugs nos caminhos de código que são acionados apenas por hardware inadequado são notoriamente difíceis de testar.

Kasperd
fonte