Por que o RAID não é um backup?

112

Quando alguém menciona o RAID em uma conversa sobre backups, invariavelmente alguém declara que "o RAID não é um backup".

Claro, para striping, isso é verdade. Mas qual é a diferença entre redundância e backup?

jldugger
fonte

Respostas:

132

O RAID protege contra um tipo de falha de hardware. Existem muitos modos de falha contra os quais não se protege.

  • Corrupção de arquivo
  • Erro humano (exclusão de arquivos por engano)
  • Dano catastrófico (alguém despeja água no servidor)
  • Vírus e outros malwares
  • Bugs de software que apagam dados
  • Problemas de hardware que apagam dados ou causam danos ao hardware (mau funcionamento do controlador, bugs de firmware, picos de tensão, ...)

e mais.

Kevin Dente
fonte
2
Um backup se recusará a copiar um arquivo corrompido?
Jldugger #
15
Depende do que "corrompido" significa, mas normalmente os aplicativos de backup têm uma configuração para isso ... no entanto, o segundo ponto de backup é manter versões diferentes do arquivo ao longo do tempo - e não apenas uma única versão - contornando o problema com uma nova versão. arquivo corrompido substituir uma versão fresca ...
Oskar Duveborn
2
> Será que um backup recusar-se a copiar um arquivo corrompido Sim, se você não pode ler os blocos de um arquivo corrompido, você não será capaz de fazer uma cópia do mesmo (backup)
Dave Cheney
1
Mas e quanto à corrupção silenciosa de dados; se um bloco de dados não funcionar, a maioria dos sistemas de arquivos não notará, notará?
Jldugger #
11
Estratégias de backup razoáveis ​​incluem manter um histórico, para que você possa voltar antes da corrupção. O tratamento mais comum da possibilidade de corrupção é fingir que isso não pode acontecer. Mas se você quiser se proteger, poderá tentar detectá-lo o mais rápido possível e em tamanhos variados de blocos (nível de bloco do dispositivo, nível da página do banco de dados, nível do arquivo). Se você detectar corrupção de dados com rapidez suficiente, ela não será mais uma corrupção de dados "silenciosa" e você terá uma chance de recuperação.
Carlito
106

P: Por que o RAID não é um backup?

R: Como todo o objetivo de um RAID é garantir que nada no mundo possa interromper esse acidente rm -rf /(ou DELTREE /X C:\), nem mesmo puxando o acorde de energia em pânico.

P: Mas qual é a diferença entre redundância e backup?

R: Se você substituir acidentalmente sua tese de doutorado com lixo, a redundância garantirá que você tenha várias cópias de lixo, caso uma fique ruim. Um backup garante que você possa restaurar sua tese de doutorado.

(E um arquivo garante que você possa recuperar várias versões antigas de sua tese, e um sistema de controle de versão também informa por que você criou uma nova versão em primeiro lugar.)

Jörg W Mittag
fonte
29

A redundância protege você contra falhas de hardware. Não protege contra erros do usuário nem contra atividades maliciosas (por exemplo, crackers entrando no seu sistema).

Veja: Por que o espelhamento não é uma solução de backup para uma lição suada.

Chris Jester-Young
fonte
7
Nem erros de software, que são mais comuns que atividades maliciosas.
Jhs
É uma ironia interessante que o artigo vinculado a essa página do Slashdot tenha desaparecido da web. Nem mesmo o Internet Archive fornece uma cópia significativa; mesmo que eles tenham rastreado a página logo após a data do artigo do Slashdot, a cópia deles simplesmente diz que a página não foi encontrada.
a CVn
Nem erros de memória, e é por isso que você precisa de ECC.
Inf3rno
19

A principal razão pela qual você deseja um backup não é porque a mídia física morreu (isso é raro), mas devido a algum erro que causou a perda ou corrupção dos dados.

O RAID não protege você contra um arquivo que está sendo excluído.

O RAID não protege você contra a substituição de um arquivo.

O RAID não protege você do comprometimento do sistema e de todos os seus dados substituídos, excluídos ou corrompidos.

O RAID não protege você da equipe de operações que acidentalmente pavimentou uma máquina com dados importantes.

O RAID não protege você de um DBA tolo executando um comando drop no servidor de produção (confundindo-o com um ambiente de teste).

O RAID não protege você se o prédio queimar.

PS http://ma.gnolia.com/ . É o que pode acontecer se você não tiver bons backups. O seu site está esgotado (existe uma observação: isso tende a ser ruim para os negócios).

Cunha
fonte
1
Portanto, você precisa construir outro edifício apenas para os backups. Trolololo. : D
inf3rno
1
@ inf3rno verifica-se que outros já construíram muitos outros edifícios.
Wedge
1
Eu não acho que http://ma.gnolia.com/é exatamente o que você significou para conectar-se a ...
um CVn
10

A redundância é excelente se um dos seus discos falhar. Não é tão bom se o seu computador pegar um vírus ou se você excluir um arquivo por engano ou se precisar restaurar o disco para uma versão anterior por algum outro motivo. É quando você precisa de um backup.

O RAID ajuda você a se recuperar de falhas, mas os backups permitem que você volte no tempo.

Chris Upchurch
fonte
8

Também deve ser mencionado que uma falha de hardware no controlador RAID pode facilmente corromper os dados em todos os discos conectados. Portanto, enquanto você reduz o risco de falhas no disco, você adiciona o perigo de falhas no controlador RAID.

sth
fonte
6

O RAID pode ser uma ótima maneira de atenuar os riscos devido a falhas de hardware, mas o RAID não o ajudará quando seus usuários excluírem (acidentalmente ou não) seus dados. Para recuperar dados, você precisa de alguns recursos de arquivamento, por meio de instantâneos locais ou backups online / offline.

tvanfosson
fonte
6
  • Várias cópias rotativas
  • Redundância geográfica

Perguntado em um comentário à pergunta aceita:

Um backup se recusará a copiar um arquivo corrompido?

Mesmo que um backup copie dados corrompidos ou incorretos, o objetivo de um backup é que você pode e deve ter várias cópias. Por exemplo, última hora, ontem, semana passada etc. Você pode obter um efeito semelhante ao usar instantâneos rotativos no seu dispositivo de armazenamento.

Mas a outra razão para backups é a redundância geográfica. Você certamente deve manter cópias de dados críticos em dois locais geográficos diferentes. A separação desses locais depende de quão críticos são os dados; manter cópias em dois edifícios diferentes na mesma cidade protege contra incêndio ou roubo. Manter cópias em dois países diferentes protege contra problemas maiores.

Jared Oberhaus
fonte
+1 para o valor da disparidade geográfica.
killermist
Grande resposta, mas eu realmente gostaria de cavar mais fundo o "maior" problema :) O que exatamente são Clasified como os problemas
Teo Carter
3

Em uma matriz RAID5, composta por discos com mais de 400 Gb, se você perder um disco, há 75% de chances de ter um erro de leitura irrecuperável enquanto a matriz está sendo reconstruída . Pense nisso por um segundo e fica bem óbvio por que alguém sempre lembrará que "RAID não é um backup".

O RAID oferece maior confiabilidade e desempenho, mas não é infalível.

saschabeaumont
fonte
3
Problema real, matemática ruim.
Paweł Brodacki
3

Qual é a diferença entre redundância e backup? Ok, configure um conjunto de discos RAID 5. Armazene algumas coisas críticas aos negócios. Puxe um disco para fora. Tudo ainda funciona! Isso é redundância. Agora exclua todos os dados (não trapaceie com a lixeira). Agora restaure-o a partir do backup mais recente. Você não tem um? Opa Bem, pelo menos você pode dizer ao seu chefe que seus discos estão usando redundância RAID 5 (quando você sai do prédio ...)

PowerApp101
fonte
1

Incêndio, roubo, falha do controlador RAID, erro humano, a lista continua

Quog
fonte
1

Considere também, com a invasão, que você tem vários discos rígidos provavelmente construídos ao mesmo tempo e depois expostos às mesmas condições por anos .... quais são as chances de que todos eles falhem ao mesmo tempo ... bastante altos

trent
fonte
3
MTBF = vida útil esperada da engrenagem!
Tetsujin no Oni
Isso não é realmente um problema com o RAID . Bem, os "mesmos padrões de uso" podem ser exacerbados pelo RAID, mas várias unidades expostas às mesmas condições não são uma função do RAID.
a CVn