Quais são os principais pontos a evitar RAID5 com SSD?

16

Meu entendimento é que um SSD tem uma quantidade limitada de gravações. O RAID5 realiza muitas gravações devido a informações de paridade nas unidades. Portanto, o raciocínio afirma que o RAID5 mataria e diminuiria o desempenho dos discos de estado sólido a uma taxa mais rápida.

A declaração a seguir deste artigo me faz pensar que não entendo completamente ou posso estar incorreto com o meu raciocínio acima.

Outro nicho para SSDs de alta resistência está em matrizes RAID paritárias. O SLC, devido à sua latência e resistência de gravação inerentemente superiores, é adequado para esse tipo de aplicativo.

Damainman
fonte
11
Você precisa se lembrar de quantas gravações são necessárias para matar um SSD .... Algo como 1 ou 1,5 milhão para SSDs de consumo.
Chad Harrison
@hydroparadise Os SSDs de consumo atual (junho de 2013, 20nm MLC) têm classificação de flash em cerca de 3000 ciclos de gravação / apagamento. Eles não param de funcionar imediatamente após 3000 gravações completas, mas falharão muito antes de um milhão de gravações.
Daniel Lawson

Respostas:

11

Seu raciocínio está correto, embora você esteja perdendo a escala do problema.

Os SSDs corporativos estão sendo fabricados com células MLC de maior resistência e podem tolerar taxas de gravação muito altas. O SLC ainda expulsa o MLC de alta resistência da água, mas na maioria dos casos a duração de gravação do HE-MLC excede o tempo de vida operacional esperado de um SSD.

Atualmente, a resistência está sendo listada como "Gravações vitalícias" nas folhas de especificações.

Como exemplo disso, a linha SSD do Seagate 600 Pro tem uma lista disso, aproximadamente:

Model   Endurance
100GB       220TB
200GB       520TB
400GB      1080TB

Dada uma vida operacional de 5 anos, para atingir a resistência listada para essa unidade de 100 GB, é necessário gravar 123 GB nessa unidade por dia. Isso pode ser pouco para você, e é por isso que existem unidades de resistência ainda mais altas no mercado. A Stec, fornecedora OEM de certos fornecedores de primeira linha, possui unidades listadas para "10x gravações de unidade completa por 5 anos". Estes são todos os dispositivos eMLC.

Sim, o R5 incorre em uma amplificação de gravação. No entanto, isso não importa na maioria dos casos de uso.


Há outra questão aqui também. Os SSDs podem realizar gravações (e leituras) tão rápido que o gargalo de E / S se move para o controlador RAID. Esse já era o caso das unidades de metal giratório, mas é posto em evidência quando os SSDs estão envolvidos. O cálculo de paridade é caro, e você terá dificuldade em obter seu desempenho de E / S com um R5 LUN criado com SSDs.

sysadmin1138
fonte
O que são SLC, MLC, HE-MLC e eMLC?
Mdpc
11
Obrigado pelo exemplo e raciocínio. Faz sentido. Meu chefe continua me dizendo para nunca usar RAID5 com SSD, em vez disso, use RAID0, RAID1 ou RAID10. Só não entendo o suficiente para debater adequadamente.
Damainman
11
@Damainman O principal motivo para não usar o R5 com SSD é que você deixa muito desempenho no chão quando faz isso. Não é por causa do desgaste mais rápido (mais).
sysadmin1138
11
Além disso, não use RAID0 se você se preocupa com seus dados. Os SSDs não falham com tanta freqüência quanto a ferrugem, mas falham. O modo de falha mais comum nos SSDs que eu vi é a falha completa do controlador, de um formulário ou de outro, o que significa perda total - seu RAID0 agora está quebrado.
precisa
2
Se você se preocupa com seus dados, faça o backup. O RAID está lá apenas para manter tudo funcionando durante uma falha no disco.
John Hunt
9

Encontrei 2 trabalhos de pesquisa sobre este tópico:

  1. Atualização de paridade aumenta a carga de trabalho de gravação e a utilização de espaço

    Introdução

    [...] Os resultados do nosso modelo analítico mostram que o RAID5 é menos confiável do que distribuir com um pequeno número de dispositivos devido à amplificação de gravação.

    Conclusão

    [...] Diferentes fatores, como o número de dispositivos e a quantidade de dados, são explorados, e os resultados sugerem que o RAID5 não é universalmente benéfico para melhorar a confiabilidade dos sistemas baseados em SSD.

    Fonte: Não deixe o RAID invadir a vida útil da sua matriz SSD
    (publicado em 02/2012)

  2. O envelhecimento igual de todos os SSDs impõe risco de falha simultânea (RAID1 e RAID6 também são afetados!)

    Abstrato

    [...] Soluções de redundância, como RAID, podem ser potencialmente usadas para proteger contra a alta taxa de erros de bits (BER) dos SSDs antigos. Infelizmente, essas soluções desgastam dispositivos redundantes a taxas semelhantes, induzindo falhas correlatas à medida que as matrizes envelhecem em uníssono. [...]

    5. Resultados da Simulação

    [...] O RAID-5 convencional faz com que todos os SSDs envelhecam de maneira bloqueada, e o RAID-4 convencional o faz com os dispositivos de dados; como resultado, a probabilidade de perda de dados em uma falha do SSD sobe para quase 1 para ambas as soluções à medida que a matriz envelhece e redefine periodicamente para quase zero sempre que todos os SSDs são substituídos simultaneamente. [...]

    Fonte: RAID diferencial: repensando o RAID para confiabilidade de SSD
    (publicado em 03/2012)

    Para proteger isso, o documento propõe um novo nível de RAID chamado Diff-RAID que faz a troca aleatória automaticamente por idade nas substituições de dispositivos).

    Você pode se proteger disso verificando manualmente o indicador de desgaste do SSD e substituindo as unidades de maneira proativa por discos sobressalentes, para que, em nenhum momento, vários discos tenham a mesma idade crítica.

TegtmeierDE
fonte
11
Uau. Isso é uma lata de vermes.
528 Patrick
7

O Parity RAID debulha seu SSD SATA de US $ 300 para desktop. Nem sequer prejudicará um SSD de nível empresarial de US $ 3000.

É tudo sobre o que você está comprando e qual é o seu caso de uso. O SSD é uma tecnologia muito mais madura do que costumava ser. No final, suas gravações MTBF e max estão se aproximando do mesmo tipo de confiabilidade que os HDDs mecânicos.

Um motivo pelo qual você pode não querer usar o RAID de paridade no SSD é que você pode saturar rapidamente um backplane ou um barramento controlador com um grande grupo de RAID SSD de vários membros. Há retornos decrescentes muito rapidamente com a velocidade de leitura dos SSDs de ponta e a largura de banda do barramento / backplane dos controladores RAID atuais. Sem mencionar que, se esses dados estão hospedando dados distribuídos pela rede, é perfeitamente possível que suas interfaces de rede sejam o gargalo antes da E / S do disco quando você estiver falando de RAIDs SSD grandes.

Basicamente, a vida útil da gravação não é tão grande, a menos que você esteja construindo seu "servidor" da Newegg, mas existem outras razões pelas quais você pode estar desperdiçando dinheiro colocando SSDs em grandes conjuntos de RAID por paridade.

MDMarra
fonte
3
É muito fácil encontrar gargalos brutos na taxa de transferência seqüencial ao usar SSDs, mesmo nos controladores RAID de última geração. No entanto, é muito mais difícil encontrar gargalos aleatórios de IO. Mesmo se você não conseguir saturar todos os seus SSDs seqüencialmente, ainda assim obterá um desempenho aprimorado em cargas de trabalho aleatórias.
Daniel Lawson
11
@MDMarra obrigado pela resposta, fiz um voto positivo em sua resposta devido aos detalhes fornecidos :).
Damainman