Devo evitar colocar dois SSDs em uma configuração RAID1 devido à degradação do desempenho?

15

Eu tenho um sistema de estação de trabalho que terá dois SSDs industriais de 64 GB e o plano é ter os dois discos em uma configuração RAID1 para redundância, que é configurada no kickstart. O sistema estará executando o CentOS 7. Ao investigar isso, descobri que o RHEL Storage Administration Guide não recomenda RAID1 para SSDs.

A Red Hat também alerta que os níveis 1, 4, 5 e 6 de RAID de software não são recomendados para uso em SSDs. Durante o estágio de inicialização desses níveis de RAID, alguns utilitários de gerenciamento de RAID (como mdadm) gravam em todos os blocos no dispositivo de armazenamento para garantir que as somas de verificação funcionem corretamente. Isso fará com que o desempenho do SSD diminua rapidamente.

É algo com que eu deveria me preocupar seriamente? Existem alternativas para redundância que eu possa usar?

De acordo com a documentação do RHEL novamente, o espelhamento LVM agora utiliza o RAID do software MD, portanto o aviso RAID também se aplica a isso.

Mais informações: Os SSDs são da série Swissbit X-200 (SATA) e parece que o provisionamento em excesso é de 40%.

O RAID de hardware não será uma opção, de acordo com a equipe de hardware.

mochatiger
fonte
Você pode elaborar qual é o aplicativo? Você está usando SSDs industriais porque esse é um ambiente hostil ou sistema de controlador de algum tipo?
EJrite
Sim, as máquinas estarão ao ar livre e terão que suportar condições ambientais / de temperatura adversas.
Mchatiger
2
Se você estiver realmente preocupado com isso, poderá mdadm -C --assume-clean...evitar a sincronização inicial. Pelo menos com RAID-1.
21414 derobert

Respostas:

10

Eu não recomendaria o RAID de software Linux com SSDs, especialmente para inicialização. Eu tomava a decisão com base no (s) cenário (s) de falha em potencial e qual é o impacto do tempo de inatividade. Para SSDs industriais, normalmente os utilizo autônomos, sem RAID.

Se esta estação de trabalho falhar, com que rapidez você pode 1). recuperação de backups ou 2). reconstruir / reimaginar?

Que tipo de SSDs são esses (marca / modelo)? Se houver excesso de aprovisionamento, isso pode não ser muito problemático. Se eles são SATA e conectados à placa-mãe, você terá algumas opções de TRIM.

Você pode usar um controlador RAID de hardware LSI de nível básico para facilitar a implantação e a recuperação. Pelo menos o RAID subjacente será transparente para o sistema operacional.


Editar:

Estes são SSDs industriais altamente superprovisionados . Configure o espelho RAID 1 como normal e apenas monitore as unidades ao longo do tempo.

ewwhite
fonte
1
Embora, se você decidir fazer o RAID de hardware, tenha certeza de que o sistema operacional suporta o hardware, para poder ver o estado dos dispositivos subjacentes ou não saberá quando os dispositivos começarão a falhar, a menos que esteja fisicamente à frente. da máquina. +1 de qualquer maneira.
21914 MadHatter
Todos os principais fornecedores de RAID de hardware fornecem software Linux que pode monitorar os dispositivos individuais atrás do adaptador. Eles podem ser vinculados ao Nagios etc. para monitoramento.
Stefan Lasiewski
Coloquei as respostas para suas perguntas sobre SSD / hardware como informações extras na pergunta (espero que esteja tudo bem, sou novo por aqui). A idéia é na rara ocasião em que uma dessas unidades falha em campo, para recuperar os dados espelhados daqueles que não falharam. O impacto da perda de dados é alto. Sabendo disso, o RAID1 ainda não seria um problema muito grande, como você disse?
Mochatiger
3
@mochatiger Sabendo o que você disse e que os SSDs são altamente superprovisionados (40%), eu configuraria o software RAID 1 conforme planejado. A documentação da Red Hat destina-se a casos de uso geral e hardware de consumidor. Sua situação é definitivamente diferente.
ewwhite
8

É algo com que eu deveria me preocupar seriamente?

Não

Existem alternativas para redundância que eu possa usar?

Eu prefiro controladores RAID de hardware, mas isso é pessoal, você está bem assim.

Chopper3
fonte
1
Chopper, você pode explicar por que não devemos nos preocupar com isso? Não devemos nos preocupar com algo que faça com que 'o desempenho do SSD se degrade rapidamente'?
Stefan Lasiewski
2
Claro, se você explicar primeiro como esse nível de trabalho pode causar o 'desempenho do SSD a degradar rapidamente', considerando as especificações de 2014 para empresas (OP usa o termo SSDs 'industriais').
Chopper3
5

A pergunta que você deve fazer é quando essa documentação foi escrita. Eles geralmente usam o mesmo material e o atualizam, se necessário, e a tecnologia SSD mudou desde então.

Embora sejam industriais, o desempenho de gravação e leitura não é o mesmo. A documentação refere-se ao desempenho de gravação, mas com uma configuração de espelho, você obterá melhor desempenho de leitura com / boot e / mounts.

Portanto, questionar a documentação em alguns aspectos vale a pena.

paulcube
fonte
1

Você pode usá-lo sem muitos problemas na configuração RAID1 flexível (mesmo que o SSD não tenha sido muito superprovisionado), mas apenas forneceu o TRIM nele após a criação.

Você pode fazer isso usando um dos seguintes:

  • usando o kernel novo o suficiente que suporta MD passando TRIM para SSD (pelo menos 3.8. algo IIRC, mas verifique) e executando fstrim (8) (do pacote util-linux) todas as noites

  • usando o kernel novo o suficiente e tendo a opção "descarte" de montagem nele (para ext4 / xfs). Observe que esse desempenho é menor do que o anterior, pois o TRIM não pode ser adquirido e não tira proveito dos lotes acima

  • em kernels mais antigos, execute o cron run noturno do mdtrim . Certifique-se de testar o script de teste fornecido antes de colocar dados importantes nele!

Observe também que tudo se aplica apenas ao sistema de arquivos diretamente no softRAID. Não funcionará para a maioria dos RAIDs de hardware. Além disso, (atualmente) não funcionará se você tiver LVM ou alguma outra camada em cima do MD softraid. Você precisará de um grande excesso de provisionamento para sobreviver a eles (e felizmente você tem 40% disso, então está bem).

Matija Nalis
fonte