Eu tenho um servidor NAS com 4x unidades WD RE4-GP de 2 TB em uma configuração RAID10 (utilizável em 4 TB). Estou ficando sem espaço (<1 TB de espaço útil restante). Eu tenho $ 0 para gastar em unidades maiores / mais / gabinetes.
Gosto do que li sobre os recursos de integridade de dados do ZFS, que - por si só - são suficientes para eu mudar do meu RAID10 XFS (software) existente. Depois, li sobre a implementação superior do RAID5 do ZFS, e pensei em conseguir até 2 TB de espaço útil na barganha usando o RAIDZ-1.
No entanto, continuo lendo mais e mais posts dizendo praticamente para nunca usar o RAIDZ-1. Somente o RAIDZ-2 + é confiável o suficiente para lidar com falhas de unidades do "mundo real". É claro que, no meu caso, o RAIDZ-2 não faz nenhum sentido. Seria muito melhor usar dois vdevs espelhados em um único pool (RAID10).
Estou louco por querer usar o RAIDZ-1 para unidades de 4x 2TB?
Devo apenas usar um pool de dois vdevs espelhados (essencialmente RAID10) e esperar que a compactação me dê espaço extra suficiente?
De qualquer maneira, pretendo usar a compactação. Eu tenho apenas 8 GB de RAM (no máximo), portanto, a desduplicação não é uma opção.
Isso estará em um servidor FreeNAS (prestes a substituir o atual sistema operacional Ubuntu) para evitar os problemas de estabilidade do ZFS no Linux.
Respostas:
Antes de entrarmos em detalhes, considere seu caso de uso. Você está armazenando fotos, rasgos de MP3 e DVD? Nesse caso, você pode não se importar se perde permanentemente um único bloco da matriz. Por outro lado, se são dados importantes, isso pode ser um desastre.
A afirmação de que o RAIDZ-1 "não é bom o suficiente para falhas do mundo real" é porque é provável que você tenha um erro de mídia latente em um dos seus discos sobreviventes quando chegar a hora da reconstrução. A mesma lógica se aplica ao RAID5.
O ZFS atenua essa falha até certo ponto. Se um dispositivo RAID5 não puder ser reconstruído, você estará sem sorte; copie seus dados (restantes) e reconstrua-os do zero. Com o ZFS, por outro lado, ele reconstrói tudo, exceto o bloco ruim, e deixa o administrador "limpar" os erros. Você perderá um arquivo / parte de um arquivo, mas não perderá toda a matriz. E, é claro, a verificação de paridade do ZFS significa que você será informado com segurança de que há um erro. Caso contrário, acredito que é possível (embora improvável) que vários erros resultem em uma reconstrução aparentemente bem-sucedida, mas devolvendo dados incorretos.
Como o ZFS é uma " violação desenfreada de camadas ", ele também sabe quais áreas não têm dados sobre eles e pode ignorá-los na reconstrução. Portanto, se sua matriz estiver meio vazia, você terá a metade da probabilidade de ter um erro de reconstrução.
Você pode reduzir a probabilidade desses tipos de erros de reconstrução em qualquer nível de RAID, realizando "zpool scrubs" ou "mdadm checks" regulares de sua matriz. Existem comandos / processos semelhantes para outros RAIDs; por exemplo, os cartões de ataque LSI / dell PERC chamam isso de "leitura de patrulha". Eles leem tudo, o que pode ajudar as unidades de disco a encontrar setores defeituosos e reatribuí-los antes que se tornem permanentes. Se eles forem permanentes, o sistema RAID (ZFS / md / raid card / qualquer que seja) pode reconstruir os dados da paridade.
Mesmo se você usar RAIDZ2 ou RAID6, as limpezas regulares são importantes.
Uma observação final - o RAID de qualquer espécie não substitui os backups - não o protegerá contra exclusão acidental, ransomware, etc. Embora os instantâneos regulares do ZFS possam fazer parte de uma estratégia de backup.
fonte
Há um pouco de um equívoco em ação aqui. Muitos dos conselhos que você está vendo são baseados em uma suposição que pode não ser verdadeira. Especificamente, a taxa de erro de bits irrecuperável da sua unidade.
Um disco barato de 'usuário doméstico' possui 1 por 10 ^ 14 de taxa de erro irrecuperável.
http://www.seagate.com/gb/en/internal-hard-drives/desktop-hard-drives/desktop-hdd/#specs
É nesse nível que você está falando de uma probabilidade significativa de um erro irrecuperável durante uma reconstrução do RAID e, portanto, não deve fazê-lo. (Um cálculo rápido e sujo sugere que os discos RAID-5 de 5 TB de 2 TB terão realmente uma chance de 60% disso)
No entanto, isso não é verdade para unidades mais caras: http://www.seagate.com/gb/en/internal-hard-drives/enterprise-hard-drives/hdd/enterprise-performance-15k-hdd/#specs
1 por 10 ^ 16 é 100x melhor - o que significa 5x 2TB é <1% de chance de falha na reconstrução. (Provavelmente menos, porque, para uso corporativo, os eixos de 600 GB geralmente são mais úteis).
Então, pessoalmente - acho que o RAID-5 e o RAID-4 ainda são eminentemente utilizáveis, por todos os motivos pelos quais o RAID-0 ainda é bastante comum. Não se esqueça - o problema com o RAID-6 é a sua grande penalidade de gravação. Você pode atenuar isso parcialmente com muito cache, mas ainda tem alguns problemas, principalmente quando você trabalha com drives lentos.
E, mais fundamentalmente, NUNCA confie no seu RAID para oferecer total resiliência. Você perderá os dados com mais frequência para um "ops" do que para as falhas de uma unidade, portanto, PRECISA de uma estratégia de backup decente se se importar com os dados.
fonte
Hummm, algumas informações ruins aqui. Para 4 discos, não há realmente nada de errado com o XFS. Costumo evitar o ZFS RAIDZ por motivos de desempenho e capacidade de expansão (baixas leituras / gravações, não podem ser expandidas). Use espelhos do ZFS, se puder. No entanto, com 4 discos e nenhum lugar para instalar seu sistema operacional, você perderá muita capacidade ou precisará passar por jogos de particionamento estranhos para ajustar seu sistema operacional e dados nos mesmos quatro discos.
Eu provavelmente não recomendaria o ZFS para o seu caso de uso. Não há nada errado com o XFS aqui.
fonte