Por que apagar arquivos com padrões aleatórios em vez de todos os 0 ou 1?

28

Na verdade, os arquivos do computador não são removidos quando são excluídos no Windows. O ponteiro de endereço é simplesmente liberado e esse espaço liberado para substituição posteriormente.

Para informações confidenciais, é recomendável que você as apague com um controle deslizante que oculte o arquivo primeiro.

Acontece que esses lavadores gravam uma sequência específica de 1 e 0 no disco rígido durante várias iterações.

Por que você não pode simplesmente escrever todos os zeros ou todos no arquivo e excluí-lo normalmente?

Como alguém conseguiu recuperar os dados de uma limpeza direta como essa mais ou menos do que usar várias iterações e padrões?

CSharperWithJava
fonte
4
Ótima pergunta.
JNK

Respostas:

15

A versão curta: teoricamente , o padrão original ainda pode ser lido por certos hardware e software sofisticados. Para garantir a segurança dos seus dados "apagados", eles devem ser limpos.

A resposta longa: http://en.wikipedia.org/wiki/Data_remanence


Edit: Para ser justo com aqueles que já votaram, estou deixando minha resposta como originalmente escrita; no entanto, leia os comentários para obter a divulgação completa.

Muitas pessoas, inclusive eu, acham que qualquer coisa mais do que uma passagem com dados pseudo-aleatórios com criptografia é um desperdício de tempo e ciclos de CPU.

Adrien
fonte
Então, para a mídia magnética, existe um pedaço legado que pode ser lido?
JNK
6
Não é um legado, mas que, em um nível separado do sistema de arquivos, os níveis anteriores anteriores de energia magnética não são totalmente neutralizados sem várias substituições com padrões variados. Definitivamente, é uma operação forense de alto dólar. (Megacorp e / ou orçamento do tipo agência de três letras) ...
Adrien
2
Este é um boato de longa data, mas não acredito que exista alguma evidência para apoiar a ideia de que isso é possível. Eu li as jornadas de várias pessoas para tentar encontrar alguém que possa fazer isso e todas elas vieram de mãos vazias. Todos chegaram à conclusão de que é um mito. Dito isto, realmente não há como saber o que acontece ou não dentro das paredes das agências de três cartas.
Jarvin
3
@ Dan: Primeiro, estou firmemente no lado "Gutmann estava no crack" do debate. "Algumas pessoas discordam dessa teoria" estava, pensei, implícita na minha "teoria", e é explicitamente mencionada no artigo vinculado. No espírito de "não duplique o esforço", eu esperava que as pessoas leiam o que já é um artigo muito bom, em vez de simplesmente regurgitá-lo aqui. Talvez eu devesse ter sido mais franco, então aqui vai: Muitas pessoas, inclusive eu, acham que qualquer coisa mais do que uma passagem com dados pseudo-aleatórios com criptografia é uma perda de tempo e ciclos de CPU. YMWV
Adrien
1
Nos velhos tempos da codificação MFM, baixa densidade de dados e motores de passo, os inversores tinham problemas em que o espaçamento entre faixas podia reter magnetização residual devido ao posicionamento frouxo da cabeça e às mudanças de temperatura. O artigo de Gutmann foi escrito em 1996. Sua substituição de 35 passes múltiplos padrões fixos foi uma tentativa de limpar uma unidade com certeza sem saber nada sobre ela. Nas décadas desde então, ele afirmou que a limpeza com dados aleatórios é suficiente para unidades modernas de alta densidade de dados.
Fiasco Labs
3

Acho que me lembro de ter lido algo sobre as propriedades magnéticas dos pratos, de modo que qualquer conjunto aleatório de bytes que sobrescreve um bloco não necessariamente desmagnetiza ou retunca totalmente uma área do disco para um estado totalmente neutro; portanto, algumas informações sobre os dados anteriores foram deixado para trás. É verdade que não acho que tenha sido muito, mas parecia suficiente que uma análise forense determinada pudesse recuperar pelo menos a natureza dos dados apagados.

A idéia dos padrões específicos de 1 e 0 é que eles são tais que funcionam com a codificação 8 / 10B do disco rígido (ou o que for) que é usada para retornar o bloco magnético de armazenamento geral a um estado neutro.

Dê uma olhada no Spinrite , que aparentemente pode mostrar os vários "níveis" magnéticos nos quais os dados são armazenados para recuperar e "atualizar" os dados em uma unidade, pelo menos é o que afirma.

Mokubai
fonte
3

Os métodos normais de recuperação somente de software não podem recuperar dados que são substituídos uma vez por qualquer padrão, é necessário um grande orçamento e técnicas sofisticadas para recuperar dados que foram substituídos apenas uma vez. Uma substituição é boa o suficiente, a menos que você tenha o FBI NSA, NASA etc., querendo seus dados. Mas se o seu paranóico substituí-lo 35 vezes, desmonte o disco rígido e triture os pratos em pó fino, depois espalhe esse pó no oceano aberto por uma viagem de 160 quilômetros; espero que você não fique preso em uma ilha no processo; )

É claro que os sistemas operacionais modernos podem deixar cópias de arquivos "excluídos" espalhados em setores não alocados, diretórios temporários, arquivos de troca, blocos defeituosos remapeados, etc., mas Gutmann acredita que um setor sobrescrito pode ser recuperado sob exame de um microscópio sofisticado e essa alegação foi aceito acriticamente por inúmeros observadores. Eu não acho que esses observadores tenham seguido as referências no artigo de Gutmann. Portanto, posso dizer que Gutmann não cita ninguém que afirma estar lendo os dados insuficientes em setores sobrescritos, nem cita artigos sugerindo que programas comuns de limpeza de disco não seriam completamente eficazes.

http://www.nber.org/sys-admin/overwritten-data-guttman.html

.

Moab
fonte
Por que se preocupar em esfregar o disco ao simplesmente aquecer os pratos acima do ponto Curie os apagará completamente? Moer em pó, se necessário, mas um bom fogo a carvão é barato.
Fiasco Labs
0

Imagine que você escreveu detalhes corporativos confidenciais em um quadro branco. Depois de sair da sala, basta limpar os detalhes do quadro. Ainda consigo ler a maior parte olhando o quadro branco de um ângulo ou usando técnicas avançadas para remover vestígios minúsculos de resíduos de marcador do quadro. Por outro lado, se você escrevesse rabiscos aleatórios no quadro depois de limpá-los, seria muito mais difícil para mim ler qualquer um dos detalhes corporativos.

Essa analogia para substituir um disco rígido com zeros e dados aleatórios é o motivo pelo qual muitas pessoas acreditam que é melhor substituir seu disco rígido com zeros e zeros aleatórios, e mais de uma vez enquanto você faz isso.

Simplesmente substituir todos os dados com zeros certamente impedirá 99,9% da população de ler seus dados confidenciais. Sobrescrevê-lo com um padrão previsível (como os computadores são inerentemente não aleatórios) de 0 e 1 tornará isso um pouco mais difícil ainda. Usar um padrão criptograficamente seguro tornará isso ainda mais difícil. E repetir esse processo aumentará ainda mais a fasquia.

Mas, devido aos retornos decrescentes, acredito que uma passagem de zeros e zeros aleatórios é mais que suficiente. Caso contrário, é melhor levar o disco rígido para uma empresa de destruição de dados segura, em vez de aumentar o desgaste da unidade e desperdiçar ciclos e tempo da CPU. Discos rígidos são baratos.

Daniel AA Pelsmaeker
fonte