Time Machine, ZFS e desduplicação

8

Atualmente, estou exportando uma partição ZFS dedup=onusando ubuntu-zfse netatalk. No entanto, a máquina do tempo insiste em criar um pacote esparso e me fez pensar se isso teria algum impacto na desduplicação, pois o conceito de "arquivos" desaparece e provavelmente o alinhamento de blocos também não seria ótimo. .

PS Minha idéia de usar a desduplicação é que tenho alguns macbooks fazendo backup no mesmo local e muitos arquivos são iguais.


Adendo: Parece que o alinhamento no nível do bloco está com falha na desduplicação. Aqui está a minha experiência:

  • Cópias da máquina do tempo de dois macbooks diferentes, com muitos dados duplicados entre eles (total de 200 GB)
  • CCC os dois macbooks para duas imagens esparsas.

Fator de desduplicação? 1.01x


Alguma idéia de como configurar a desduplicação do ZFS para funcionar corretamente com backups de máquinas do tempo? Devo começar a procurar outras alternativas de backup (com dedução)?

Hugo Sereno Ferreira
fonte
A compressão parece realmente uma opção melhor. Poderia ser criptografia, no entanto? Dois arquivos criptografados com o mesmo conteúdo podem muito bem "parecer" diferentes para o sistema de arquivos abaixo devido ao funcionamento da criptografia. Imagino que a desduplicação funcione bem em volumes não criptografados , mesmo que seja um arquivo enorme e não um pacote esparso.
precisa

Respostas:

7

A desduplicação no ZFS é no nível do bloco, portanto, não depende do conceito de arquivos. A única maneira de derrotar a desduplicação é se o deslocamento de um arquivo no pacote esparso nem sempre for o mesmo módulo do tamanho do bloco. Como o ZFS pode usar tamanhos de bloco variáveis ​​maiores que o tamanho do sistema de arquivos HFS + dentro do pacote esparso, o alinhamento correto não é garantido, mas também não é garantido que a desduplicação falhará.

Se você estiver preocupado com espaço, também poderá ativar a compactação no seu pool ZFS. Ele impõe uma sobrecarga extra na CPU, mas pode realmente aumentar a taxa de transferência efetiva do disco.

user5516
fonte