Estratégia RAID - 8 unidades de 1 TB

8

Estou configurando um dispositivo de armazenamento de backup - esta máquina possui o Windows Server 2008, em uma unidade de inicialização separada.

Possui unidades de 8x 1 TB e usa uma placa RAID de hardware.

Minha pergunta é: qual configuração de RAID devo usar?

Inicialmente, eu usaria o RAID 5 em todas as 8 unidades, mas os membros do serverFault não recomendaram. Eu só estava me perguntando por que?

Algumas pessoas sugeriram 2 lotes de configuração de RAID 5 em 4 das unidades e depois as distribuíram ...

Desejo maximizar o espaço de armazenamento, pois esta é uma unidade de backup - armazenará backups SQL, Imagens Acronis, arquivos, etc ... Não será para acesso público, portanto a E / S não será tão alta. não pensaria.

alex
fonte
7
ZFS é o que você realmente quer :)
Bill Weiss

Respostas:

19

Para um backup a frio puro, eu diria que o RAID5 está bem. O RAID5 levará um tempo considerável para restaurar em unidades SATA de 8x1TB, mas, dadas as chances de algo quebrar com IOPS baixo, provavelmente isso não é crítico. Se você deseja um pouco mais de segurança, escolha o RAID6, que lhe permitirá sobreviver a duas falhas de disco simultâneas.

Mark S. Rasmussen
fonte
3
Atualmente, estou usando um RAID6 com 8 unidades de 1 TB e funciona muito bem.
Phuzion
6
+1 para sugestão de Raid 6
Aaron:
11
+1 RAID 6. Nesse aplicativo, o desempenho geralmente não é tão importante. Se você estiver preocupado com o tempo de recuperação, dependendo dos seus dados, o RAID 10 com compactação poderá render o armazenamento necessário e diminuir o tempo de reconstrução.
duffbeer703
outro +1 para RAID6. Eu tenho 7x750GB em RAID6, e funciona muito bem (e tive drives morrendo algumas vezes e se recuperou bem).
James Cassell
4
Há cerca de 60% de chance de um erro de leitura irrecuperável ao reconstruir uma matriz RAID5 de 8 discos que consiste em unidades de 1 TB. RAID6 e RAID10 são as únicas opções tradicionais seguras nesse cenário, mas o que você realmente deseja é RAIDZ2. Mais sobre grandes matrizes RAID5 e erros de leitura irrecuperáveis.
Skyhawk
15

Aqui está um bom artigo sobre: Por que o RAID 5 para de funcionar em 2009

Aqui está um resumo rápido:

  • Falha no disco: Com 7 discos, você tem ~ 20% de chance de ver uma falha no disco em um ano. É bem provável que você veja uma falha durante a vida útil operacional do armazenamento.
  • Falhas de leitura: "As unidades SATA geralmente são especificadas com uma taxa de erro de leitura irrecuperável (URE) de 10 ^ 14". Isso significa que, para hipotéticos 12 TB de armazenamento, é provável que você veja falhas de leitura. Isso é apenas uma função da quantidade crescente de armazenamento comumente usada. Mais armazenamento, mais falhas de leitura.

Funciona assim, de acordo com o autor: Mais discos (maior probabilidade de falha no disco) + mais espaço em disco (maior probabilidade de falha de leitura) = Maior probabilidade de ambos os eventos acontecerem ao mesmo tempo . O que matará sua matriz RAID é quando um disco falha e enquanto a matriz está sendo reconstruída, você tem uma falha de leitura.

A solução do autor: RAID-6

Aqui está um comentário que parece resumir bastante bem:

O ponto principal que parece estar faltando em muitos dos comentários é que, quando um disco falha em uma matriz RAID 5 e precisa ser reconstruído, há uma chance significativa de um erro de leitura não recuperável durante a reconstrução (BER / UER). Como não há mais redundância que a matriz RAID não pode reconstruir, isso não depende de você estar executando Windows ou Linux, hardware ou software RAID 5, é uma matemática simples. Um controlador RAID honesto registrará isso e geralmente abortará, permitindo restaurar dados não danificados do backup em uma nova matriz.

Notas do editor: Você pode usar apenas unidades SCSI ou SAS de qualidade ...

rkthkr
fonte
11
Bom artigo e bom argumento. Eu tenho muito conhecimento folclórico e tribal sobre RAID que simplesmente não é suportado pela matemática. É essencial entender a lógica e as probabilidades do RAID.
#
Há um bom ponto levantado neste artigo, mas não posso concordar com as conclusões. O autor afirma que o RAID-6 também não é uma solução e eu questiono a validade dessa declaração.
dtoubelis
Resumo muito bom. Acabei de construir uma matriz 13TB RAID5 e parece ser muito ruim solução
Jan Zahradník
O mesmo autor escreveu "Por que o RAID 6 para de funcionar em 2019"
5

Se você optar pelo RAID 5, sofrerá um pânico de parar o coração por um dia ou mais enquanto a matriz é reconstruída para incluir sua substituição. Se você optar pelo RAID 6, quando uma unidade falhar, poderá ocorrer uma falha adicional durante a reconstrução, para que o pânico de parar o coração seja reduzido a um alarme leve.

Se fosse eu, eu iria para 6 - mas então eu tenho problemas com a minha pressão arterial, por vezes, como é ...

James Green
fonte
3

Minha recomendação é ir com o RAID-6 sem nenhuma dúvida. Especialmente considerando que você está usando unidades de 1 TB.

Aqui está a minha experiência. Nos últimos 4-5 anos, estivemos executando 3 matrizes RAID-5 com unidades de 2 TB - 2 por 5x e 1 por 10x (espero não ser um enigmático aqui :-). Durante esse período, tivemos 3 ou 4 falhas no disco rígido. Somente uma vez que a matriz foi reconstruída sem problemas. Todas as outras vezes houve erros durante a reconstrução. Um deles foi catastrófico e nos custou US $ 12.000 em taxas para a empresa de restauração de dados. A gravidade de uma falha dependia muito da inteligência do software / firmware RAID. A falha catastrófica ocorreu com o RAID do software Linux. Falhas recuperáveis ​​ocorreram com o controlador de hardware Adaptec. (Essencialmente, marca apenas uma faixa como ruim se descobrir um URE e continuar. fsckApós a reconstrução e você voltar aos negócios. Você pode perder um ou dois arquivos, mas não toda a matriz.)

Desde então, migramos nossos dados para matrizes RAID-6 com bons controladores de hardware. Tivemos uma falha na primeira unidade há alguns meses e a recuperação foi um problema.

Muitos justificarão o uso do RAID-5 vs RAID-6 por razões de desempenho (estou citando parcialmente minha própria resposta a outro tópico aqui), ... essa diferença de desempenho é TEÓRICA. Pela minha experiência, a diferença de desempenho REAL entre o RAID-6 e o ​​RAID-5 é insignificante ou inexistente. Estou falando de RAID de hardware com controlador decente com pelo menos 8 unidades e sistema com memória suficiente para fornecer um bom armazenamento em cache. Nesta configuração, a velocidade de gravação provavelmente será limitada pela largura de banda do barramento SATA / SAS / SCSI ...

Outra desvantagem ou RAID-6 é o custo dessa unidade extra. Mas deixe-me colocar em perspectiva. Provavelmente você pagaria entre US $ 200 e US $ 500 a mais por unidade extra, mas compare-o com o custo do tempo de inatividade ou das taxas de recuperação, se algo der errado ... Considere isso como um prêmio de seguro :-)

dtoubelis
fonte
1

Eu diria que escolha Raid5 acima de 7 discos e mantenha um como HS. Mas tudo realmente depende do controlador RAID que você está usando e do tipo e qualidade de suas unidades.

dyasny
fonte
11
Por que você desperdiçaria uma unidade que pudesse ser facilmente usada para melhorar a capacidade ou a tolerância a falhas?
Nic
se você acha que os discos de hotspare são um desperdício, não há muito mais que eu possa lhe dizer. dar-lhe tempo, você verá o uso de HS, se você ficar por tempo suficiente
dyasny
Estou disposto a me convencer, então criei uma nova pergunta sobre o assunto.
Nic
1

Você precisará descobrir quanto seus dados valem, em dólares do mundo real, e quão irritante ou dispendiosa será uma falha antes que você possa pensar em estratégias de armazenamento. Uma dica é que a resposta não pode ser "sem perda alguma", porque isso tem um custo infinito.

Use esse custo / tempo / dados para orientar quanto tempo você pode tolerar uma reconstrução, quantas horas o sistema pode ficar inativo ou quanto dinheiro você deseja gastar em hardware.

Jim Zajkowski
fonte
0

No meu arquivador, corro um ataque de software 5 em oito unidades s-ata de 500 GB, o que funciona muito bem. Desempenho de leitura próximo a 160 MB / s, desempenho de gravação em torno de 90 MB / s. O tempo de recuperação é de cerca de 20 horas. Athlon X2 4200+ e chipset nvidia.

Como isso deve ser usado para armazenamento de backup, não vejo a necessidade do RAID 6. É improvável que duas unidades no RAID de backup falhem dentro de alguns dias, ao mesmo tempo em que os dados de produção são danificados ou perdidos.

Roy
fonte
0

O RAID5 entre 8 discos deve ser bom, exceto que terá um desempenho de gravação ruim, pois precisa calcular o bit de perity. O desempenho da leitura deve ser realmente ótimo.

Tenho certeza de que o número máximo recomendado de discos para RAID5 é 12, mas tudo depende de como você está usando o array, se você pode usar tantos, quanto mais discos você adicionar, mais lenta será a reconstrução e a gravação.

ITGuy24
fonte
11
Você está errado. Suppors Adaptec mais de 12 discos em um Raid 5.
TomTom
Há uma diferença entre o que é suportado e o recomendado como prático para um ambiente de produção. Eu estava fazendo uma recomendação não declarando um fato quantitativo.
ITGuy24
Eu nunca vi um número tão alto para o número "recomendado" de discos, sempre passei por 6 ou menos apenas porque os discos adoram morrer em grupos. Mais de 12 expõe você a uma grande perda de dados em potencial.
Matthew
0

Se for apenas para fins de backup e IO não importa, o RAID 5 deve ser bom, o RAID 6 seria ainda melhor, mas você perderia espaço de armazenamento. Qual é a importância dos seus dados? Você também pode fazer o raid 5 + 0 composto por dois Raid 5 de 4 discos. Isso permitiria perder 2 discos, fornecer IO melhor e deixá-lo com cerca de 6 TB utilizáveis, mas há uma boa possibilidade de o seu controlador não suportar (geralmente requer coisas de alto nível). O Raid 6 é o mais lento de todas as opções, permite que você perca 2 discos e ainda o deixará com cerca de 6 TB utilizáveis.

Mateus
fonte