Como combinar dois conjuntos de arquivos

2

Eu tenho vários backups muito desorganizados de diretórios pessoais (mesmo usuário) que gravei ao longo dos anos. De vez em quando, eu apenas copiava o diretório pessoal inteiro para um novo diretório em um enorme disco rígido. O formato do diretório inicial mudou muito ao longo dos anos e alguns arquivos grandes e importantes foram simplesmente removidos para economizar espaço (eu sabia que havia um backup). Pior ainda, alguns arquivos foram movidos de algo como myfilepara old/myfile.

Agora, quero combinar esses backups em um diretório abrangente que tenha uma e apenas uma cópia de tudo (apenas a cópia mais recente). Gostaria de ferramentas que usem coisas como nome de arquivo, data de modificação e SHA1Checksums para combinar esses arquivos. Quais são algumas boas ferramentas que podem fazer isso?

Por favor, não dê conselhos sobre como eu deveria ter usado o software de backup. No entanto, eu não me importaria de ouvir alguns recursos de software que ajudam a converter esse modelo atual e confuso em um modelo de backup centralizado.

obrigado

Usuário1
fonte

Respostas:

4

O método mais simples que consigo pensar é copiar cada pasta uma de cada vez (na ordem da data do arquivo) em uma pasta principal. Em seguida, use o software de deduplicação para digitalizar a pasta mestre e remover itens duplicados.

Chris Nava
fonte
0

Eu mesmo tenho esse problema. Estou pensando em usar o software de controle de versão (por exemplo, git ou Subversion (veja também: TortoiseGit e TortoiseSVN )) para fazer isso por mim. Supondo que você geralmente tenha seus backups agrupados em timestamps progressivos - ou seja, você tem, por exemplo, / backup1 / de 2010, / backup2 / de 2012, / backup3 / de 2015, etc ... (em oposição às datas de backup que estão sendo misturadas em cada árvore de diretórios) - então isso funcionará perfeitamente. Isso permitirá que você:

  1. Combine todos os seus arquivos de backup em um repositório, no qual você pode acessar todos os arquivos de forma organizada.
  2. Confirme cada árvore de diretórios de backup em ordem cronológica e mantenha-a dessa maneira.
  3. Compare facilmente versões de arquivos (especialmente arquivos de texto, usando um utilitário diff ) entre si.
  4. Continue usando este sistema para confirmações futuras, para que você nunca precise fazer isso novamente.

O único problema é que o software de controle de versão normal não se adapta bem a cargas de pastas e, principalmente, a arquivos grandes e / ou binários (executáveis). No entanto, existem soluções de controle de versão criadas para isso. Encontrei três aparentemente boas (ainda não testei) que funcionem no Windows e no Linux:


Obviamente, se você moveu subdiretórios inteiros em seus backups ao longo do tempo, como eu fiz, essas soluções de controle de versão quase certamente não entenderão isso. Para isso, existe um software de deduplicação, que você pode executar na confirmação final da árvore de diretórios de backup, que deve ter todos os arquivos mesclados (já que os diretórios movidos serão simplesmente confirmados, ignorando sua duplicidade). :)

Espero que ajude...

Andrew
fonte