Minha organização comprou recentemente um sistema de armazenamento. Possui 1,5 Petabyte, com RAID6, e há um espelho sincronizado online em um local físico diferente.
O sistema permite recuperação de arquivos / recuperação, por padrão, permitindo até 30 dias, mas isso pode ser aumentado.
Há uma discussão em andamento se precisarmos de algum tipo de backup extra para dados que residem apenas no armazenamento.
O sistema possui um nível muito bom de redundância, possui redundância geográfica e permite até certo ponto reversão, o que significa que podemos recuperar até o tempo definido (30 dias por padrão) dados antigos ou dados excluídos acidentalmente.
Dado esse cenário, ainda faz sentido ter um backup "tradicional"? Por tradicional, refiro-me a um sistema de backup dedicado, com instantâneos que podemos recuperar caso algo dê errado.
Nós realmente precisamos disso? Estou esquecendo de algo? Estou apenas pensando da maneira tradicional e sendo zeloso?
Respostas:
O que você descreve é essencial: um RAID geograficamente distribuído e um RAID nunca foi um backup .
A sincronização online geralmente significa que tudo que você faz no armazenamento primário é replicado imediatamente no sistema de backup, incluindo operações como a exclusão de (todos) instantâneos e / ou volumes por um invasor ou simplesmente um erro de administrador.
fonte
A reversão de 30 dias é uma excelente capacidade, mas e se "arquivo-xyz de importância crítica" ficar corrompido / danificado e isso não for detectado até mais de 31 dias depois? Essa situação é a diferença entre agendamentos de backup e arquivamento, mas na sua descrição o último não é mencionado. Os sistemas de arquivamento geralmente são armazenados em fita de custo muito baixo. Além disso, não há informações disponíveis sobre se a empresa possui requisitos regulamentares ou outros para reter dados por mais de 30 dias, o que geralmente ocorre.
Se esse não for o seu caso, você deve ser bom.
fonte
Ter máquinas geograficamente separadas e ter os dados é bom.
O que acontece quando você tem várias falhas envolvendo ambos ou todos os seus sites? Um incêndio em um, roubo dos servidores no outro? Ou há um problema com a linha entre eles, o servidor do local principal apaga-se e o controlador HD ape e escreve lixo? Ou algum insider executa atos maliciosos em ambos? Ou o FBI confisca seus servidores nos dois locais por suspeita (você nunca, mas talvez esteja co-hospedado em um datacenter com idiotas). Ou ... Lembro-me de várias interrupções de alto nível na "nuvem", onde tudo era redundante, analisado até o enésimo grau, mas, ainda assim, as coisas podem dar errado. Concordo que tudo isso é improvável, mas você reconheceu que coisas improváveis podem acontecer.
Então, tudo se resume à importância / valor desses dados? O que a organização fará se acabar?
fonte
A pergunta aqui parece ser sobre o quão desconectada e geograficamente distinta uma cópia replicada dos seus dados precisa ser antes de ser uma infraestrutura de backup e não de alta disponibilidade / redundância. Meu instinto é que você está perto, mas ainda precisa de um backup.
Para reunir algumas idéias nas outras respostas e comentários, você pode ir muito longe no caminho de "bem, a tecnologia X não cobre o cenário de desastre em Y, portanto não é um backup" e, em algum momento você precisa decidir o que é razoável para você, o que parece ser o motivo de você estar perguntando. Minha opinião sobre isso, e acho que muitos dos comentaristas, é que seu backup precisa existir em uma infraestrutura tecnológica separada dos dados em uso, para que falhas, acidentes e ações maliciosas não possam se propagar ou ter um obstáculo muito maior para atravessar. Um exemplo dado nos comentários é alguém excluindo os volumes, o que é um cenário válido, não torta no céu, na minha opinião. Além disso, um exemplo do mundo real do meu trabalho. A universidade em que trabalho (mas felizmente não gerenciar esta infraestrutura para) possui uma infraestrutura de virtualização séria de alta disponibilidade que suporta muitas instalações do campus. Está em vários sites, mas está sendo executado na plataforma de um fornecedor. Um bug obscuro surgiu um dia que causou uma cascata de falha que derrubou primeiro um único servidor; depois, quando a carga mudou, ele removeu o restante do site e, quando a carga mudou novamente, removeu os outros sites que hospedavam essa infraestrutura. (Eu acredito que eles resolveram esse problema desde então). Os dados não foram perdidos nesse caso, mas é possível imaginar um cenário que envolva seus dados onde eles estavam. Um bug obscuro surgiu um dia que causou uma cascata de falha que derrubou primeiro um único servidor; depois, quando a carga mudou, ele removeu o restante do site e, quando a carga mudou novamente, removeu os outros sites que hospedavam essa infraestrutura. (Eu acredito que eles resolveram esse problema desde então). Os dados não foram perdidos nesse caso, mas é possível imaginar um cenário que envolva seus dados onde eles estavam. Um bug obscuro surgiu um dia que causou uma cascata de falha que derrubou primeiro um único servidor; depois, quando a carga mudou, ele removeu o restante do site e, quando a carga mudou novamente, removeu os outros sites que hospedavam essa infraestrutura. (Eu acredito que eles resolveram esse problema desde então). Os dados não foram perdidos nesse caso, mas é possível imaginar um cenário que envolva seus dados onde eles estavam.
Você deseja que seu backup seja imune a tudo isso e até acessível enquanto essa infraestrutura estiver inativa. Se os dados estiverem indisponíveis por uma semana enquanto o RAID for reconstruído, a recuperação de documentos críticos para os negócios a partir do backup é boa (embora não seja necessária). Se o seu RAID desaparecer e depois replicar para o outro site, você realmente desejará que o backup seja de um fornecedor separado ou de uma mídia isolada, como fita.
Tudo isso dito, repetirei novamente que seu backup deve estar em uma infraestrutura separada dos seus dados. Existem muitos níveis de isolamento aqui, mas acho que qualquer coisa conectada através da replicação direta está muito perto para ser um backup. Você vai querer algo além disso.
fonte
Suposição: o sistema de armazenamento será usado por muitos aplicativos.
Eu considero que você fará muito melhor com um sistema de backup separado.
O RAID e o espelhamento não são de backup, mas o recurso de reversão embutido pode substituir um sistema de backup tradicional.
MAS:
Prefiro que as políticas de recuperação sejam baseadas em aplicativos / dados e não em armazenamento porque:
fonte