RAID 6 vs RAID 10? Qual você escolheria

11

Minha escolha seria RAID 6 para um servidor de arquivos, pois você pode perder duas unidades e não importa qual conjunto de duas pode morrer. Pelo que entendi com o RAID 10, você pode perder duas unidades, mas se elas estiverem na mesma matriz RAID 1, você estará sem sorte? Alguma sugestão? Servidor de arquivos básico com cerca de 200 GB de dados e atuaria como um único ponto de backup para outras estações de trabalho e servidores.

dasko
fonte
"ponto único de backup" significa um repositório de backups da rede. esse é o ponto em que você faz backup na mídia. eu nunca iria fazer backup de um servidor e depois outro e depois outro. que iria trabalhar se você tivesse apenas um, temos cerca de 10.
Se seu objetivo real é ter um local "seguro" para armazenar backups, eu compraria uma pilha de discos, trocaria todos os dias e colocaria os não utilizados em um local seguro, ou melhor ainda, fora do local, em um local seguro . O RAID apenas ajudará no desempenho e no tempo de atividade, mesmo com uma única falha no disco, mas não se o servidor derreter ou o prédio queimar. No passado, isso era feito com unidades de fita, mas hoje em dia, discos extras são provavelmente uma maneira muito mais econômica e fácil de gerenciar.
Jed Daniels
dasko, algum dos itens abaixo responde à sua pergunta?
James Cape

Respostas:

12

Depende do que você está tentando fazer. Embora o Raid 10 permita leituras e gravações mais rápidas dos dois, como você disse, é possível perder tudo se você perder as duas unidades erradas. Porém, em matrizes de disco maiores, você pode perder exatamente metade das unidades e manter as operações completas. Mas com o Raid 6, suas gravações podem ser um pouco mais lentas c / c da soma de verificação extra. Mas você pode perder duas unidades e não perder dados.

Eu acho que outro ponto importante a lembrar é que o Raid não é um backup de dados . Portanto, a principal coisa que o RAID deve considerar é o tempo de atividade do servidor. Não mantendo os dados intactos.

Eu acho que no final é uma questão de preferência. Eu iria pessoalmente com o Raid 10; Para matrizes realmente grandes, você pode obter um RAID 50 ou 60. Onde o disco no conjunto listrado pode ser protegido com o RAID 5 ou o RAID 6.

Boa leitura:

Ryan Gibbons
fonte
2
Embora o RAID não seja um backup ... nesse caso, acho que sua definição de backup é sólida. Como os dados originais residem em estações de trabalho e outros servidores e estão sendo copiados para esse servidor. O que acontece ao usar o RAID para ajudar na disponibilidade.
3dinfluence
5
Deixe-me adicionar então: O backup online não é um backup. Se for um backup, ele deve ser armazenado em fita / disco e colocado em um cofre em algum lugar distante do restante dos sistemas. O RAID não ajuda nisso.
pehrs 8/03/10
1
Eu acho que isso também depende dos tipos de unidades usadas, mas para um servidor de arquivos básico, o RAID 6 é suficiente. Reserve o RAID 10 para o servidor SQL de alta carga.
murisonc
4
@cypher Os sistemas de backup on-line têm duas propriedades muito desagradáveis: 1: É possível limpar todo o backup por acidentes ou bugs no sistema de backup, geralmente sem aviso prévio. A verificação e a restauração de um sistema offline são feitas somente leitura, reduzindo os riscos para seus backups. 2: Um backup on-line provavelmente não está em um cofre à prova de fogo sem conexões externas. Depois de ter um eletricista alimentando 480V no seu salão de servidores, você aprende essa lição.
pehrs 25/11/10
2
O principal problema do ataque é que isso significa que as unidades estão constantemente em uso e sujeitas a desgaste, aumentando significativamente a probabilidade de falha do que uma unidade offline ou backup em fita. Também não protege contra corrupção de dados ou exclusões replicadas. As fitas / unidades offline podem ter seus próprios problemas, a única maneira insensata é a utilização de vários estágios.
JamesRyan
7

[Suponho que você esteja confortável com o impacto no desempenho do RAID6 e se preocupe apenas com falhas]

Estou usando os números de http://en.wikipedia.org/wiki/Standard_RAID_levels e sou péssimo em matemática, portanto, isso pode estar errado. Vamos supor que 5% das suas unidades morram dentro de 1 ano.

A probabilidade de um membro dupla RAID1 outright morrer é a probabilidade de uma determinada unidade morrendo, quadrado: P(R1) = P(drive)^2.

Portanto, com a taxa de falha de 5%, você acaba com:

P(R1) = 0.005^2 = 0.0025 = 0.25%

(Aqui é onde eu não tenho certeza sobre a matemática - faz sentido, mas isso não significa nada)

Portanto, as chances de perder qualquer membro do R1 são de 0,25% ao ano, mas você tem vários deles unidos e, se algum deles morrer, sua matriz estará morta. então você precisa para ligar o número P (R1) na matemática falha R0: P(R10) = 1 - (1 - P(R1))^(n_R1). Suponhamos que você tenha 8 unidades no total (e não as substitua quando elas falharem), portanto, uma faixa entre 4 R1s:

P(R10) = 1 - (1 - 0.0025)^4 ~= 0.99%

Portanto, você tem cerca de 1% de chance de perder um RAID10 com 8 unidades com 5% de chance de falha por ano.

De maneira simplista, a probabilidade de falha do RAID6 é a probabilidade de qualquer unidade morrer, em cubos (desde que você precise perder três unidades para que falhe), por exemplo:

P(drive)^3 = (5%)^3 = 0.0125%

Portanto, no cenário "várias unidades morrendo", o RAID6 tem cerca de 1/80 de probabilidade de falhar do que o RAID10 com as mesmas unidades.

Infelizmente, a vida é complicada e você precisa lidar com setores que estão indo mal. É bem provável que erros aleatórios sejam introduzidos em suas unidades que passam despercebidos. Não estou mais copiando a wikipedia aqui, mas acho que a probabilidade de um setor ruim aparecer em qualquer unidade é P(bs) = P(UBER) * bits_written. Se isso acontecer, a recuperação após uma falha na unidade é impossível em um R1 e mais complicada em um R6.

Obviamente, tudo isso é discutível se o controlador ou driver RAID6 estiver com erros e introduzir erros nos seus dados ou corromper sua matriz :-)

James Cape
fonte
2
Essa matemática é boa, mas durante uma reconstrução, as unidades de paridade / espelho são especificamente afetadas mais do que qualquer outra e, portanto, têm muito mais probabilidade de falhar do que a taxa média de falhas. Portanto, é mais provável que o RAID10 perca essa segunda unidade específica.
JamesRyan
1
paridade / espelho é uma unidade em RAID10, mas espalhados por todas as unidades de RAID6
JamesRyan
2
Outra consideração é que as unidades compradas em lotes tendem a morrer em lotes, o que torna as falhas em vários discos mais comuns do que a matemática simples sugere. (A lição aprendida da maneira mais difícil!)
mattdm
1
Embora o RAID10 geralmente seja construído usando apenas pares RAID1 de 2 unidades, nem sempre é o caso. O Linux mdadmpermite criar um layout RAID10 com qualquer nível de redundância (2, 3, 4, ...), desde que seja menor que o número de unidades na matriz (portanto, é possível criar um RAID10 com duas cópias de dados com apenas 3 unidades). A --layout=opção permite definir o número de cópias.
precisa saber é o seguinte
2

Para uma estação de trabalho ou um servidor que consome muita CPU, eu votaria no RAID 10 para obter um melhor desempenho de leitura / gravação.

Para um servidor de armazenamento de dados, eu usaria o RAID 6.

Se possível, eu usaria o RAID 10 na minha estação de trabalho e servidores e um RAID 6 em um servidor de arquivos para manter os arquivos de backup.

wag2639
fonte
0

Os servidores de arquivos geralmente são mais vinculados pelo link de rede. Portanto, para um servidor de arquivos típico, eu optaria pela proteção extra que o RAID6 oferece, pois no final do dia a velocidade na rede será o gargalo da garrafa.

Se você estiver executando algo local no servidor, como um grande banco de dados ou máquinas virtuais, eu optaria pela configuração do RAID10.

3dinfluence
fonte
0

O Raid6 é muito mais seguro que o R1. A probabilidade é de 5% de que o disco falhará durante um ano. O Raid6 falhará se 3 discos morrerem no mesmo dia. Portanto, a probabilidade é 0,05 * 1/365 = 0,000014. Assim, a probabilidade de falhar no Raid6 é de 2,6 E-12, que é muito menor do que a probabilidade de ganhar na loteria. Se o disco for quebrado no array Raid6, você poderá alterar is e o controlador RAID começará a reconstruir o array RAID imediatamente. É preciso app. 1 dia para f. ex. disco de 2 TB reconstruído na matriz Raid6. Portanto, você deve ter falhas durante um dia ou até menos se estiver usando um disco menor que 2 TB.

Mas, como dito aqui, mantenha um backup real em execução contínua. Algum dia, sua fonte de energia pode morrer e fornecer voltagem extra ao seu sistema e todos os discos rígidos podem ficar offline depois disso, exatamente assim (ou algo do gênero acontece, quem sabe). Normalmente, isso não acontece, mas se você realmente precisar de seus dados, volte para outro lugar que não seja o Raid array.


fonte