A pergunta pode ser imprecisa, então tentarei explicá-la com mais detalhes.
Por várias razões, tenho muitas cópias do mesmo arquivo no meu sistema de arquivos Linux. Muitos deles são bastante grandes.
Digamos que possuo /path/to/some.file
e cópias deste arquivo /other/path/file.name
e /yet/another/path/third.copy
. Gostaria de saber se existe um sistema de arquivos que literalmente faria dois desses arquivos agirem como uma referência ao original. Naturalmente, se o usuário modificar um deles, somente então eles se tornarão arquivos independentes.
PS. Eu sei que isso pode ser (parcialmente) realizado usando links. Mas quero que esse recurso que tentei explicar acima seja tratado de forma transparente pelo sistema de arquivos.
linux
filesystems
DejanLekic
fonte
fonte
Respostas:
Esse recurso é chamado de deduplicação . Nenhum dos sistemas de arquivos Linux populares (ext *) o suporta, mas aparentemente o ZFS o suporta parcialmente . Há também uma tabela de sistemas de arquivos listando, entre outros, a desduplicação, mas não parece haver nenhuma escolha popular - é um recurso planejado para o Btrfs.
Eu acho que verificar periodicamente o seu sistema de arquivos e criar links físicos apropriados é o melhor que você pode fazer no momento, embora isso não implique cópia na gravação.
fonte
A palavra-chave principal que você deseja procurar é "copiar na gravação". O BTRFS possui uma operação de clone que faz exatamente o que você deseja e
cp --reflink
fará o que você está procurando, desde que o seu sistema possua um kernel e coreutils 7.5 modernos o suficiente. Fonte do Wiki Além disso, bedup é uma ferramenta que mescla duplicatas em um volume inteiro. O CoW também é o recurso de direção abaixo da tecnologia de captura de imagens da btrfs, IIRC.fonte
cp --reflink
mas note que realmente quero que o FS detecte clones e use referências em vez disso, de forma transparente. Também estou fora dabedup
ferramenta.cp --reflink
/ clone) ou uma ferramenta separada para concluir o trabalho mais tarde (hora de dormir).Existe um sistema de arquivos online S3QL projetado para backups com grande capacidade de desduplicação.
fonte
Zfs, btrfs, ext3cow, bcachefs (disponível, mas há uma chance de ainda não estar implementado). A Microsoft tinha um em desenvolvimento, mas eles pararam por razões desconhecidas.
fonte