Atualmente, estou exportando uma partição ZFS dedup=on
usando ubuntu-zfs
e netatalk
. No entanto, a máquina do tempo insiste em criar um pacote esparso e me fez pensar se isso teria algum impacto na desduplicação, pois o conceito de "arquivos" desaparece e provavelmente o alinhamento de blocos também não seria ótimo. .
PS Minha idéia de usar a desduplicação é que tenho alguns macbooks fazendo backup no mesmo local e muitos arquivos são iguais.
Adendo: Parece que o alinhamento no nível do bloco está com falha na desduplicação. Aqui está a minha experiência:
- Cópias da máquina do tempo de dois macbooks diferentes, com muitos dados duplicados entre eles (total de 200 GB)
- CCC os dois macbooks para duas imagens esparsas.
Fator de desduplicação? 1.01x
Alguma idéia de como configurar a desduplicação do ZFS para funcionar corretamente com backups de máquinas do tempo? Devo começar a procurar outras alternativas de backup (com dedução)?
Respostas:
A desduplicação no ZFS é no nível do bloco, portanto, não depende do conceito de arquivos. A única maneira de derrotar a desduplicação é se o deslocamento de um arquivo no pacote esparso nem sempre for o mesmo módulo do tamanho do bloco. Como o ZFS pode usar tamanhos de bloco variáveis maiores que o tamanho do sistema de arquivos HFS + dentro do pacote esparso, o alinhamento correto não é garantido, mas também não é garantido que a desduplicação falhará.
Se você estiver preocupado com espaço, também poderá ativar a compactação no seu pool ZFS. Ele impõe uma sobrecarga extra na CPU, mas pode realmente aumentar a taxa de transferência efetiva do disco.
fonte