Armazenamento de longo prazo de dados críticos para os negócios

16

Este é realmente complicado e, até certo ponto, não é um problema técnico e pode não pertencer a este local, mas

Falha no servidor é para administradores de sistema ... que gerenciam ou mantêm computadores em uma capacidade profissional

E eu faço .. e esta é uma das minhas tarefas .. Enfim.

Imagine que você tinha mais de 5000 páginas em frente e verso de A4. Dados da empresa, todos críticos para os negócios.
Você precisa fazer o backup, de alguma forma. As soluções propostas até agora são:

  1. PDF -> Armazenamento online
  2. PDF -> DVD / BluRay / Fita
  3. PDF -> Unidade de disco rígido portátil / SSD / Flash.
  4. Compre / alugue / alugue / 'Roube' uma grande fotocopiadora e faça cópias.
  5. ???

Problemas imediatos com o acima exposto:

  1. E se o parceiro de armazenamento falir?
  2. Os DVDs apodrecem com o tempo. Fitas da mesma forma.
  3. Estes também quebram com o tempo.
  4. Caro. Lento. Pesado. Não é árvore amigável.

As questões):

Qual é o padrão-ouro para preservação e arquivamento de dados de longo a médio prazo? Você resolveu um problema semelhante no local de trabalho?

Após o carregamento inicial, há algum requisito para adicionar à coleção cerca de 100 páginas por mês. A recuperação deve ser possível, facilmente, mas provavelmente não é frequente.
Idealmente, eu gostaria de garantir que a solução seja viável muito tempo depois de deixar a empresa e que não será necessária uma quantia enorme para mantê-la em manutenção. Portanto, o armazenamento de muitos DVDs não é apenas ideal, mas também não é ideal. uma boa solução a longo prazo.

Embora apenas fazer cópias em papel seja certamente o mais fácil, não é o mais ecológico, nem por um longo caminho. Também não é muito gerenciável, difícil de pesquisar, indexar e assim por diante. Combinado com pesado e difícil de armazenar fisicamente.

Eu gosto bastante da idéia, em princípio, de ter tudo armazenado eletronicamente, mas o mecanismo real de fazer isso precisa ser transparente e fácil. Eu realmente não quero ser responsável por isso para sempre e por um dia, apoiando os usuários do escritório à medida que aumentam e perdem documentos. Também não quero depender de um único fornecedor de armazenamento, e se o Dropbox (tivermos uma solução de backup on-line ATM, mas não é o Dropbox.) Falir ou experimentar um evento catastrófico, quantas empresas quem está usando seus serviços estaria no riacho, sem remo?

Há alguma flexibilidade de orçamento aqui, mas suspeito que qualquer coisa que custe mais do que o nosso backup on-line atual (que é de 2500 USD / ano) seria visto de maneira menos favorável do que apenas colocá-lo em uma caixa de sapatos embaixo da cama. O que é sem dúvida o que aconteceria se eu não fizesse nada e me demitisse amanhã.

Alguma ideia?

-Editar-

A razão para fazer isso é dupla.

1) fornecer um backup seguro e sensato da papelada essencial para os negócios, no caso de o escritório queimar.

2) para satisfazer as leis de arquivamento de dados da WRT uk para empresas e assim por diante.

Edição 2:

Ter algum mecanismo para indexar os documentos também seria muito útil.

Tom O'Connor
fonte
Eu escrevi um script rápido para fazer PDF-> Txt com ghostscript e gocr. Despreocupadamente, considerando colocar tudo em um banco de dados SQLlite para criar um índice interessante para os dados.
Tom O'Connor
Redundância (de mídia digital) e manutenção da redundância ao longo dos anos podem ser seu melhor amigo.
Vortico 25/09/12

Respostas:

5

Manter os dados em um formato como PDF provavelmente é seguro, porque existem ferramentas gratuitas para lê-los. O volume de dados de que você está falando é bastante pequeno (1.200 páginas / ano); mesmo com uma resolução de digitalização de 300 dpi, você está falando apenas de dezenas de gigabytes por ano.

O problema do dispositivo de armazenamento físico nunca vai desaparecer. Qualquer mídia que você usar para armazenar dados eletrônicos (fita, óptica etc.) acabará por precisar ser atualizada para uma mídia mais nova. Planeje e orce para "lançar os dados no caminho" para novos formatos, à medida que novos formatos substituem formatos antigos.

Eu provavelmente consideraria a mídia óptica a primeira escolha simplesmente porque você tem poucos dados. Eu também planejaria gravar 3x duplicatas de tudo e atualizar a mídia a cada 2 ou 3 anos.

Se a mídia ótica for muito pequena, eu usaria fita LTO e atualizaria a mídia a cada 4-5 anos. Isso vai ser bem caro, no entanto, para uma quantidade tão pequena de dados.

Evan Anderson
fonte
DVD? Ou Blu-ray? O BR já é um formato sensato para dados?
Tom O'Connor
11
@ Tom O'Connor: Eles parecem iguais para mim. Eu consideraria o custo para tomar essa decisão. Existem espaços em branco de Blu-Ray de "nível de arquivamento" disponíveis agora, portanto, de uma perspectiva técnica, parece um formato viável. (Os fabricantes que dizem que a mídia Blu-Ray tem uma vida útil de 200 anos não me dão mais confiança do que aqueles que disseram que a mídia de DVD de arquivo teve uma vida útil de 100 anos ...)
Evan Anderson
Eu tenho alguns CD-Rs Kodak GOLD de aproximadamente 1998, e eles ainda são legíveis. Eu também tenho alguns gratuitos, onde a camada de tinta se separou e eles estão ferrados.
Tom O'Connor
Não estou sugerindo que não haja diferença entre mídia arquivística e mídia não arquivística. Estou simplesmente dizendo que a mídia de qualidade de arquivo Blu-Ray versus a mídia de qualidade de arquivo em DVD não me parece muito diferente. Comparar o grau de arquivo versus a mídia "eixo de 100 por US $ 20,00" é uma história totalmente diferente.
Evan Anderson
Um item não mencionado foi o armazenamento em estado sólido (pen drives USB): maior que o óptico, menor que o LTO. É provável que o USB esteja presente por pelo menos mais uma década ou duas, e um pen drive de 16 GB ou 32 GB (ou duas ou três) é muito barato em termos de custo de arquivamento. Como vai para Write-Once-Read-Many, você não precisa se preocupar com o desgaste das células SSD, portanto, teoricamente, você pode manter paus por 5 ou mais anos em um cofre à prova de fogo.
precisa saber é o seguinte
6

Existem sistemas específicos que usam DVDs internamente e migram os dados para novas mídias de vez em quando. Procure preservação digital.

Como os requisitos de armazenamento aumentam rapidamente, é aconselhável mudar para um tipo de mídia maior e mais novo a cada poucos anos.

Supondo que você obtenha os dados em papel, você precisa:

  1. Listar os dados na entrada de email. Isso pode significar atribuir a cada folha um código de barras exclusivo.
  2. Digitalize. Use o identificador de código de barras como nome do arquivo. Arquive o papel.
  3. Arquive os dados. Coloque os dados em um sistema de arquivamento seguro de revisão. Um servidor de arquivos não será bom o suficiente, porque algo pode acontecer com os arquivos se eles estiverem acessíveis para gravação.
  4. Torne a leitura acessível para outros sistemas.

No caso de clientes, são todas as faturas para grandes organizações que precisam ser transferidas para o sistema online (SAP). O armazenamento do arquivo morto passou por várias iterações até agora. Atualmente eles estão se mudando para o raio azul.

Por outro lado, hoje em dia tudo fica em discos, então talvez algo nesse sentido seja o seu caminho: http://www.eurostor.com/german/iTernity.D.php

Posipiet
fonte
Lembre-se de que a maioria dos DVD-R (et al) dura apenas alguns anos antes da degradação. As coisas caras de "arquivo" duram mais se mantidas de acordo com as instruções.
Chris S
O mesmo acontece com a maioria dos discos, servidores, sistemas de arquivos ou formatos de documento. Arquivar significa mover os dados. Tente ler um pdf em 20 anos. Você se lembra qual era o padrão há 10 anos? Na verdade, não temos nada que se aproxime do papel. Exceto para copiar e colar ...
Posipiet
Os documentos de texto puro ainda são bastante legíveis.
Bart Silverstrim
Existem ferramentas gratuitas para ler PDFs. Desde que sejam "baunilha pura", eu não ficaria muito preocupado. TIFF também é uma boa opção.
Evan Anderson
3

Nossa solução: Digitalizar para PDF -> Backup em fita

Temos um scanner de documentos, produz ~ 30 páginas / min e produz arquivos PDF OCR. Apoiamos aqueles em fita (LTO4 especificamente), que tem uma vida útil de 50 a 100 anos (encontrar uma unidade de fita pode ser difícil no período de tempo, mas existem locais de recuperação de dados que ainda recuperam disquetes de 8 ").

Chris S
fonte
2
Eu tive que google 8 "disquete ....
Holocryptic
Eu guardo minhas fitas de backup do Mac OS 7.5. Mas o disco quebrou, a mídia dos programas de backup foi perdida. Consegui reinstalar o Mac, mas não consigo ler a fita porque não tenho o programa de backup. E, francamente, eu nem me lembro do nome. Sim, a fita pode durar 100 anos. Mas o leitor não.
Posipiet
@Holocryptic: Apenas alguns meses atrás eu joguei fora uma caixa fechada de Verbatim difícil sectored 8" disquetes.
user9517
11
@Holocryptic: NSFW! NSFW !!
Bart Silverstrim
@ Posipiet, acho que cobri o fato de que as unidades não duram para sempre, mas existem empresas especializadas em recuperar dados de praticamente qualquer mídia usada.
Chris
3

Penso que o novo serviço Glacier da Amazon é uma oferta interessante neste espaço.

O Amazon Glacier é otimizado para dados que são acessados ​​com pouca frequência e para os quais os tempos de recuperação de várias horas são adequados. Com o Amazon Glacier, os clientes podem armazenar grandes ou pequenas quantidades de dados com segurança por apenas US $ 0,01 por gigabyte por mês, uma economia significativa em comparação com as soluções locais.

ewwhite
fonte
2
Os custos de recuperação são incrivelmente imensos.
Tom O'Connor
2

Etapa 1, Backup: faça o OCR dos documentos e reorganize todas as palavras em uma série de romances sobre a Igreja Católica, o Opus Dei e os Templários. Você deve ter dados de entrada suficientes para cerca de 10 romances e cerca de um a cada ano ou mais para sempre. Manter uma tabela de pesquisa que contenha as palavras localização original nos documentos de origem (em ordem de origem) e sua localização final nos romances; armazene palavras duplicadas em uma entrada da tabela. Assegure um acordo de publicação e publique milhões de romances. Use a receita das vendas de livros para financiar a operação de OCR e rearranjo de palavras. Fragmente os documentos originais e os venda como roupas de cama de hamster. Ocasionalmente, pode ser necessário fazer pedidos de compra de crucifixos, antimatéria ou passagens aéreas para locais exóticos, se você achar que está faltando vocabulário nos documentos de entrada.

Etapa 2, Recuperação / acesso: Não há necessidade de armazenar cópias dos dados - tudo o que você precisa é sua tabela de pesquisa e uma livraria de segunda mão.

Como a tabela de pesquisa é seu único ponto de falha, você ainda precisará fazer o backup. Graças ao esquema de codificação huffman empregado, este será bastante pequeno, comparado aos documentos de entrada, portanto provavelmente poderá ser copiado para DVD. Para backup externo, sente-se na frente de uma lareira e leia a tabela de pesquisa enquanto filma. Coloque sua peça de performance de vídeo na fusão de arte e tecnologia na Tate Modern Gallery, em exibição permanente.

Duncan Lock
fonte
1

Um pouco cedo para comprar, mas parece que o HDS criou um mecanismo permanente de armazenamento de dados baseado em quartzo - faça uma leitura .

Chopper3
fonte
11
Já ouvi a reivindicação de permanência tantas vezes que nunca vou acreditar e nenhum de nós vai viver o suficiente para ver isso provado. As previsões de permanência são absolutamente inúteis e invariavelmente se tornam erradas.
John Gardeniers
-2

Preciso apresentar o Humyo.com (comprado pela Trend Micro - cujo nome do meio é segurança)

Eles criptografam todos os dados do usuário e seus servidores são armazenados no Bank Of England em um cofre.

Bastante seguro :)

benhowdle89
fonte
11
Aposto que eles não estão realmente no Banco da Inglaterra. Não há espaço lá, está cheio de banqueiros.
Tom O'Connor
5
Trend Micro, cujo nome do meio é bloatware ...
Tom O'Connor
Eu concordo com você sobre Trend Micro, mas eles só ele próprio, você operar com software do Humyo
benhowdle89