Qual é o melhor: RAID5 + 1 Hotspare / RAID6? [fechadas]

45

Apenas curioso, tenho 6 x 1TB 7200RPM Near Line SAS para o meu novo servidor. Posso configurá-lo como RAID5 + 1 Hot Spare ou RAID6.

O que devo escolher?

Raptor
fonte
1
Eu especulo que daqui a cinco anos ... muitas pessoas estarão perguntando .. o que é RAID? Vai sair muito em breve, mas ainda é relevante por hoje.
28414 Matt
1
Então, porque muitas pessoas expressam opiniões em vez de fatos, fechamos o tópico e não deixamos que os fatos sejam discutidos? Isso parece errado. Há um cálculo matemático que mostra por que o RAID 6 é melhor para segurança, capacidade e como a velocidade é afetada. Nenhuma opinião envolvida.
Scott Alan Miller

Respostas:

36

Você tem desvantagens e vantagens em cada abordagem; depende de por que você está usando RAID. A maioria das pessoas o usa para disponibilidade. Eles não querem que uma unidade morra e acabem tendo que derrubar seu sistema ou servidor. Nisso, você não usa o RAID 5. Aprendi da maneira mais difícil e enfatizo esse ponto com todas as perguntas relacionadas ao RAID que entro no SF.

Por quê? Como as unidades estão ficando maiores, há mais tolerância ao URE, erros de leitura irrecuperáveis. Tivemos que acontecer e não é o que você deseja descobrir no meio de uma reconstrução. Cenário: sistema RAID com 3 unidades. Recebemos um alarme em nossa Dell com uma placa PERC de hardware que levou a unidade C a morrer. Encomende uma nova unidade, troque-a, sem problemas. No meio da reconstrução, ele morreu.

De acordo com o diagnóstico, havia um "ponto ruim" na unidade B. O sistema falhou silenciosamente nessa unidade repetidamente, e agora que estava reconstruindo os dados, não era possível ler esse local e não importa quantas vezes executamos o reparo diretamente no controlador e cada vez que dizia que tudo estava consertado, ele não era restaurado. Portanto, temos uma unidade morta e uma unidade que não conseguiam ler de um local ... acabamos substituindo 2 unidades e restaurando a partir do backup.

Lição: O RAID não é um backup e o RAID 5 não é mais uma opção de disponibilidade para unidades maiores.

Se você deseja aumentar a velocidade ou aumentar o tamanho do armazenamento, pode equilibrar isso em sua decisão. Você precisa definir suas necessidades em termos de suas necessidades e objetivos, não em termos de "Preciso de RAID, qual uso?"

Bart Silverstrim
fonte
1
As unidades destinadas a operações RAID geralmente falham na correção de erros muito rapidamente e relatam a falha ao controlador. A idéia é evitar situações como você descreveu acima - o bloco defeituoso é remapeado e os dados recuperados da paridade, em vez de o disco ser marcado como ruim porque "trava" por 45 segundos tentando recuperar esse bloco. A Western Digital ainda possui um utilitário para alterar o comportamento de recuperação de erros de seus discos, embora o utilitário não seja "oficialmente" lançado.
chris
7
Eu não pude seguir o argumento. Você está dizendo que usa RAID 6 ou RAID 5?
Martin
@martin: estou comentando a preocupação de que certos tipos de falhas de disco sejam tratadas de maneira diferente, dependendo do design do destino do próprio disco. Martin descreveu uma falha em vários discos como resultado de um "ponto ruim" em um disco, que em algumas situações não causará (e não deve) causar uma reconstrução completa da matriz. No processo de reconstrução da matriz, outro disco falhou, resultando em um dia ruim.
chris
@chris - Desculpe pela confusão - eu não estava comentando o seu comentário. (Não estava lá quando eu postei.) Minha pergunta foi direcionada a Bart: não consegui descobrir se ele estava dizendo que o RAID 5 é um item obrigatório ou se o RAID-5 não é suficiente e apenas o RAID 6 o faria.
Martin
2
@ Chris-não sei mais qual seria a diferenciação, mas os PERCs são baseados em hardware, cache onboard, ferramentas de gerenciamento integradas, hot swap etc. e, embora a Dell não esteja necessariamente cobrando dez mil pelos servidores, é bastante razoável. popular no ambiente corporativo. As unidades devem relatar erros; é assim que você recebe mensagens de erro e alertas. Mas os UREs são algo que acontece com os drives e eles não parecem estar cientes disso até fazer algo como ... oh ... reconstruir uma matriz. Então de repente "Ei! Há um problema aqui também!"
Bart Silverstrim
16

Use RAID6. Leia "Por que o RAID 6 para de funcionar em 2019" por Robin Harris no ZDNet.

rasgou-
fonte
4
E depois de 2019?
Mat
2
@ Mat Hi do ano em que o RAID 6 para de funcionar. ;-) Isso realmente deveria ter acontecido no artigo, mas você precisará analisar a codificação de apagamento , normalmente implementada com superamostragem polinomial sobre GF (256) . Isso significa que níveis de redundância (quase) arbitrários podem ser usados, por exemplo, 9 + 3 ou 12 + 4. A principal desvantagem é que é um pouco mais caro computacionalmente do que as paridades RAID 6 ou RAID 5.
Arne Vogel
9

O RAID 5 nunca deve existir com um hot spare (hot spare). O RAID 6 é sempre um uso melhor da mesma contagem de unidades.

http://www.smbitjournal.com/2012/07/hot-spare-or-a-hot-mess/

Não há vantagem de espaço / capacidade ou vantagem de custo para a solução RAID 5 (mas alguma pequena vantagem de desempenho), mas é uma tonelada para mitigar coisas como o risco de URE.

Scott Alan Miller
fonte
3
O RAID-6 é substancialmente mais lento que o RAID-5 + uma reposição quente. RAID-6 nem sempre é melhor.
Stefan Lasiewski
2
O RAID-5 (ou o RAID-6) com um sobressalente pode fazer todo o sentido da perspectiva da contagem de unidades, se você tiver mais de uma faixa que pode compartilhar um único sobressalente. Isso permite que a nova transformação inicie imediatamente quando uma unidade falhar e substitua a unidade com falha o mais rápido possível, mas quando conveniente , em vez de tentar substituir a unidade com falha antes que ocorra outra falha.
um CVn 21/11
2
O RAID 6 é mais rápido nas leituras, mais lento nas gravações. Mas somente quando aleatório. Seqüencial, é mais rápido em ambos. Mas a diferença de segurança é épica, uma ordem completa de diferença de magnitude. Adicione um cache de gravação como qualquer hardware de classe comercial que o RAID possua e as gravações aleatórias do RAID 6 caem drasticamente. É muito raro que o R6 seja mais lento que o R5, pois possui o eixo extra.
Scott Alan Miller
A reforma imediata é realmente o perigo, porque é a operação de recuperação que coloca a matriz em maior perigo. O R6 com um hot spare é totalmente diferente do R5 com um hot spare. O R5 com um hot spare nunca deve existir porque você usa a mesma unidade no R6, mas ganha velocidade e confiabilidade. Não é necessário resilver, a proteção já está em vigor sem o risco de URE da operação do resilver.
Scott Alan Miller
6

É fácil - você quer mais espaço em disco disponível ou a capacidade de sobreviver à falha de discos - é simples assim.

Então, farei algumas suposições - que você não se importa com o desempenho, pois são 7.2 e que se preocupa com o espaço disponível, pois são discos de 1 TB - não menciona que tipo de dados deseja para armazenar, mas vou assumir que são apenas arquivos de vídeo ou uma combinação de vídeo e áudio. Se eu estiver certo, presumivelmente você lutaria para substituir os dados? nesse caso, eu escolheria nem 5 ou 6, mas seguiria com o R10, sim, você perde 1TB sobre R6 e 2TB sobre R5, mas será mais rápido e poderá sobreviver a três discos pop. Se eu estiver errado e você puder recuperar seus dados rapidamente, poderá usar o R5 para obter o máximo de espaço disponível.

Chopper3
fonte
1
“Sim, você perde 1 TB acima do R6 e 2 TB acima do R5, mas será mais rápido e poderá sobreviver a três discos que estouram.” - Isso se você tiver sorte; na pior das hipóteses, você não sobreviverá a mais de uma falha na unidade (se a segunda estiver no mesmo par RAID 1 que a primeira). Se não me engano, com falhas de 1, 2, 3 e 4 unidades, a probabilidade cumulativa 'ingênua' de ter que recorrer ao backup é 0, 1/5, 3/5, 1, respectivamente (o número de zero sendo o número de falhas de unidade que podem ser toleradas com segurança). Com o RAID 6, é 0, 0, 1, o que é um pouco mais fácil de se trabalhar, além de você não perder esse terabyte extra.
James Haigh
2
Você está certo, James, as coisas mudaram nos últimos CINCO ANOS (OMG há muito tempo - uau!) E agora eu só recomendo R6 / 60 e R1 / 10.
Chopper3
4

Embora o desempenho seja uma preocupação, não é uma preocupação tão grande quanto você pensa. O hardware RAID mais recente será o mais rápido na gravação de duas faixas de paridade, assim como em uma faixa.

Além disso, as unidades SAS geralmente têm uma taxa de erro de bits mais baixa, que se traduz em um erro de leitura irrecuperável (URE) mais baixo. Geralmente, uma ordem de magnitude (10x), no entanto, se a unidade SAS for do mesmo modelo que uma unidade SATA, talvez você não veja uma melhoria.

Finalmente, quanto à questão do RAID-5 e dos UREs e como isso pode arruinar o seu dia, escrevi um artigo sobre isso há algum tempo em: http://subnetmask255x4.wordpress.com/2008/10/28/sata- erros irrecuperáveis ​​e como isso afeta a invasão / na qual abordo algumas dessas perguntas. Basicamente, o RAID-6 em um bom hardware (não o RAID de software) deve mostrar desempenho equivalente ao RAID-5. Se você tiver um hardware ruim ou estiver usando o RAID de software, verá um impacto no desempenho.

Como sempre, os backups são sua graça salvadora. Não se esqueça de implementar uma política de backup E verifique se ela pode ser recuperada.


fonte
2
Uau, eu acho que estava em todo o lugar com esse. O que eu estava tentando dizer é que, considerando suas unidades, se você tiver um bom controlador RAID de hardware, o RAID 6 não terá desvantagens em relação ao RAID 5 com um hot spare (o +1). No entanto, se você não tiver um bom controlador RAID de hardware, verá leituras e gravações mais lentas, sendo as gravações um pouco mais lentas que as leituras. Se você estiver usando apenas RAID por software, verá uma leitura mais lenta e gravações muito mais lentas. Bom hardware - RAID 6; Hardware ruim - RAID 6 com desempenho atingido; Somente software - RAID 5 (+1) e ore muito.
3

Muitos bons conselhos aqui, principalmente de Bart e Chopper3.

A única coisa que gostaria de adicionar é testar sua carga de trabalho sob uma condição de falha. As pessoas geralmente configuram um RAID-5 / RAID-6 para comprar disponibilidade (ou seja, o servidor não está inativo devido a falha no disco). Infelizmente, para algumas cargas de trabalho - especialmente cargas de trabalho pesadas, você pode achar que o impacto no desempenho é grave o suficiente para você não estar comprando muito.

Se o seu teste funcionar, ótimo - apenas não se esqueça de planejar e testar uma estratégia de backup.

duffbeer703
fonte
2

Acho que o RAID 5 vs. 6 (e vs. 10) se resume ao desempenho e ao quanto você confia nas marcas de unidades que usa. Utilizamos principalmente servidores HP e armazenamento HP e tivemos muito poucas falhas de disco, por isso estou feliz com o hotspare de RAID5 + ou mesmo apenas com RAID5 em sistemas menos críticos.

Em teoria, o RAID6 evita a ocorrência de uma segunda falha de unidade enquanto uma primeira unidade com falha está sendo reconstruída, mas você troca isso contra o aumento dos cálculos necessários para gerar duas faixas de paridade diferentes. Como não usamos 6, nunca vi nenhuma especificação sobre a rapidez com que um array RAID6 pode ser reconstruído em relação ao RAID5, mas presumo que o 6 demore mais, pois ele precisa fazer 2 cálculos de paridade, não apenas um.

Se eu fosse me afastar do RAID5, provavelmente usaria 10 (ou 01) para me livrar completamente dos cálculos de paridade. Com 6 unidades, você pode fazer isso, embora tenha apenas metade da capacidade.

Ala
fonte
2

RAID6. Dessa forma, se dois discos falharem em uma sucessão relativamente rápida, para que a matriz não tenha terminado a reconstrução desde a primeira falha (ou dois discos falhem ao girar após uma queda de energia), você não perdeu todos os seus dados.

xenny
fonte
1

O Raid6 tem mais sobrecarga, portanto o raid5, como tal, será mais rápido na mesma quantidade de unidades. Por outro lado, você pode perder a vantagem quando um disco morre e o rai5 é reconstruído, você corre o risco de perder a matriz se outra unidade morrer durante a reconstrução.

No seu caso, você está executando o raid5 vs 6 em uma quantidade diferente de spindles, portanto, devido ao spidle raid6 adicional, pode ser mais rápido.

dyasny
fonte
1

Boas respostas, exceto que ninguém mencionou o desempenho de gravação. O RAID 6 geralmente oferece um leve impacto no desempenho na gravação em comparação com o RAID 5, pois há duas faixas de paridade a serem mantidas.

No entanto, a maioria acha que vale a pena usar o RAID 6.

kmarsh
fonte