SSDs de consumidor (ou prosumerador) vs. HDD rápido em um ambiente de servidor

28

Quais são os prós e os contras dos SSDs de consumidor versus unidades giratórias rápidas de 10 a 15k em um ambiente de servidor? Não podemos usar SSDs corporativos em nosso caso, pois eles são proibitivamente caros. Aqui estão algumas notas sobre nosso caso de uso específico:

  • Hipervisor com 5-10 VMs máx. Nenhuma VM individual ficará louca com I / O intensivo.
  • RAID 10 interno, sem SAN / NAS ...

Eu sei que SSDs corporativos:

  1. são classificados para vida útil mais longa
  2. e ter um desempenho mais consistente por longos períodos

do que os SSDs de consumo ... mas isso significa que os SSDs de consumidor não são adequados para um ambiente de servidor ou ainda terão um desempenho melhor do que as unidades giratórias rápidas?

Como estamos protegidos por RAID / backup, estou mais preocupado com o desempenho ao longo da vida útil (desde que não se espere que a vida útil seja muito baixa).

David Budiac
fonte
1
Forneça informações específicas sobre as marcas / modelos de hardware envolvidos. E sistemas operacionais ... e hipervisores ... Talvez até o que as VMs estejam fazendo. Mais detalhes!!
ewwhite
@ewwhite servidores em rack Dell. Provavelmente um R430 ou R730 com um controlador RAID PERC H730. Também é provável que um servidor HyperV hospede principalmente o Windows Server Standard ... possa usar VMware sobre HyperV. Ainda considerando. Inicialmente, as VMs serão: controlador de domínio, DNS, WSUS, serviços de implantação. Também pode adicionar um servidor web interno.
David Budiac
1
E quanta capacidade você precisa?
ewwhite
@ewwhite 2TB utilizável no mínimo
David Budiac
superuser.com/questions/834521/… vale a pena ler. São cerca de 10 mil unidades consumidoras , mas muitos dos pontos ainda são relevantes aqui.
Journeyman Geek

Respostas:

22

Nota: Esta resposta é específica para os componentes do servidor descritos no comentário do OP.

  • A compatibilidade ditará tudo aqui.
  • Os controladores de matriz Dell PERC são dispositivos LSI. Portanto, qualquer coisa que funcione em um controlador LSI deve ficar bem.
  • Sua capacidade de monitorar a saúde de sua matriz RAID é fundamental. Como é a Dell, verifique se você possui os agentes, alarmes e monitoramento adequados para informar sobre erros do seu controlador PERC.
  • Não use RAID5. Não fazemos mais isso no mundo sysadmin .
  • Mantenha um sobressalente à mão.
  • Você não precisa necessariamente acessar um disco do consumidor. Existem unidades SSD empresariais disponíveis em todos os preços. Peço às pessoas que comprem SSDs SAS em vez de SATA sempre que possível.
  • Além disso, é provável que você também encontre preços melhores no equipamento oficialmente suportado (ninguém paga no varejo).
  • Não ouvidos ao vodu sobre a rotação de unidades SSD para tentar enganar o controlador RAID ou seus algoritmos de nível de desgaste. O caso de uso que você descreveu não terá um impacto significativo na vida útil dos discos.

Veja também: As unidades SSD são tão confiáveis ​​quanto as unidades mecânicas (2013)?

ewwhite
fonte
2
Eu já ouvi isso casualmente antes ... para não usar mais o RAID5. Principalmente por causa da confiabilidade? E o que você usa no lugar RAID6? RAID10?
David Budiac 21/07
1
+1 boa resposta. Eu realmente não consideraria comprar SSDs de nível de consumidor para uso em um PERC H700 / H710 / H730. Basta pesquisar no Google por "drives não certificados PERC H730" muitas pessoas já tentaram isso antes e acabaram com problemas. Pelo menos compre SSDs de nível de entrada mais baratos, como o já mencionado Intel S3500.
S1lv3r
1
Boa resposta, mas seria bom se você adicionasse algum raciocínio por trás de suas sugestões (por exemplo, o link que você postou nos comentários). Por que a compatibilidade é importante é óbvio, mas por que você está favorecendo o SAS em vez do SATA?
Sebb 21/07
1
@ Sebb Já escrevi sobre isso.
ewwhite
8

Sim, os SSDs serão muito mais rápidos que os drives SAS. Para taxa de transferência seqüencial, um bom RAID de unidades SAS pode funcionar muito bem, mas para acesso aleatório, os SSDs os expulsarão da água, o que pode resultar em uma diferença de desempenho muito perceptível.

Dependendo das unidades SAS específicas e das unidades SSD específicas, os SSDs podem ter uma taxa de erro de leitura irrecuperável melhor em até um fator de 10.

Algumas dicas para se você usar unidades SSD de consumo:

  • Conheça sua carga de trabalho de gravação para estimar com que frequência precisará substituir as unidades, pois elas têm uma certa duração de gravação
  • Se você pode poupar espaço, provisione em excesso as unidades para torná-las mais parecidas com as da empresa
  • Confira artigos comparando o desempenho e as características de resistência de gravação dos SSDs da mesma classe e escolha o que melhor se adequa às suas necessidades
  • Pessoalmente, eu receberia SSDs com uma garantia de 5 anos porque acredito que o fabricante oferecerá melhor qualidade como resultado. Eu sei que essa não é uma regra rígida, apenas uma crença pessoal.
  • Existem unidades SSD de baixo custo e uma de ponta alta - às vezes rotulada como "Pro" -, talvez você queira procurar por essa classe
  • Isso também vale para as unidades empresariais, mas certifique-se de monitorar o MWI (indicador de desgaste de mídia) para saber quando substituir as unidades
sa289
fonte
O excesso de provisionamento é uma boa dica para as cargas de trabalho pesadas de gravação.
ewwhite
7

Os SSDs de nível de consumidor funcionarão bem em muitos servidores para casos de uso.

Eles são muito, muito mais rápidos que os discos SAS. Eu sugeriria que o motivo para obter discos corporativos sobre discos de consumo não é a velocidade, são os ciclos de leitura e gravação e uma melhor engenharia - por exemplo, as supercaps estão presentes em alguns SSDs corporativos em que a versão de grau de consumidor não tem isso - se você perder poder para o servidor, é menos provável que seus dados sejam mortos.

Você precisa estar ciente de que o RAID não é de backup - se você quiser fazer o RAID com alguns SSDs, tudo bem, mas obter marcas diferentes de SSDs ou pelo menos modelos diferentes para que eles tenham características de desempenho diferentes. Quando os SSDs morrem, eles são muito mais propensos a fazê-lo sem aviso e sem capacidade de extrair dados - por outro lado, eles são 10x mais confiáveis ​​do que os discos rígidos comuns.

Olhe para os discos da série Samsung 850 - pelo menos por 1/2 da matriz - eles são / foram prosumer e oferecem um bom retorno financeiro, e são apontados como mais confiáveis ​​do que os 2d nand. (Eles usam 3d nand).

Além disso, como outra pessoa mencionou, não faça RAID5. As unidades aguentam muito para que funcione de maneira confiável - e faça backup de seus dados.

davidgo
fonte
Só para acrescentar, o 850 pro é o ideal. o padrão 850 usa TLC
Journeyman Geek
@ JourneymanGeek - Eu acho que o 850 EVO e o 850 Pro usam 3d nand - é a série 840 que não. Isso é feito pelo site da Samsung - samsung.com/global/business/semiconductor/minisite/SSD/global/… - tenho muito menos certeza, mas acho que o 850 pro tem supercaps e melhor engenharia, mas a memória é muito semelhante se não for idêntico.
Davidgo
@ Davidgo É por isso que você compra a Intel;). A menos que as coisas mudem, os SSDs da Intel deixarão de aceitar gravações quando falharem e permanecerem legíveis para que os dados possam ser copiados. techreport.com/review/26523/…
DetlevCM
3
@DetlevCM: permaneçam legíveis até a primeira reinicialização na qual eles se conectam intencionalmente. Isso por si só os desqualifica automaticamente para qualquer uso sério.
precisa saber é o seguinte
@MSalters Não é suposto .... (ele deve permanecer legível - não apenas gravável)
Detlevcm
6

Se você estiver usando-os para gravações, para evitar corrupção de dados no caso de falta de energia, certifique-se de considerar apenas os modelos com supercap. Por exemplo. Intel S3500, Samsung 845DC Pro

Caso contrário, os SSDs do consumidor são mais adequados para o cache.

JamesRyan
fonte
Eu votei positivo mesmo que eu discorde. Certamente supercaps, etc, são uma boa idéia para um SSD - daí o voto positivo -, mas isso implica que os SSDs dos consumidores não são confiáveis ​​- não acredito que isso esteja correto - na verdade, afirmo que eles são 10 vezes mais confiáveis ​​do que girar discos rígidos. Além disso, os discos rígidos não têm supercaps ou equivalente - e são mais vulneráveis ​​a quedas de energia. A coisa é que os sistemas de arquivos modernos têm revistas para mitigar o risco de perda (e há certas speedups você não deve usar em uma unidade a menos que tenha um backup ASSESSUPLAN / bateria)
davidgo
3
@davidgo porque HDs não mentem sobre o cache escritas de sincronização enquanto um monte de SSDs consumidor fazer
JamesRyan
Isso, isso, mil vezes isso. Os SSDs de clientes mentirão para o controlador RAID , possibilitando a perda de dados mesmo em projetos RAID altamente redundantes. Se você usa SSDs na empresa, deseja o capacitor integrado.
Joel Coel
6

Mesmo os SSDs de nível de consumidor são muito mais rápidos que os HDs de 15k mais rápidos, portanto, do ponto de vista do desempenho, eles ficarão bem ( se estiver usando o disco certo e se os provisionar em excesso), mas você precisava escolhê-los com cuidado , principalmente devido à maneira como eles interagem com eles. controlador RAID baseado em hardware ...

  1. Primeiro, verifique se está disponível ao seu alcance uma unidade de nível empresarial acessível (como Intel S3500 / S3600, Micron M500DC e Micron M510DC). Nesse caso, você pode pular toda a loteria de consumo.
  2. Verifique se suas placas RAID suportam discos de terceiros. Por exemplo, o firmware DELL anterior para placas H700 / H710 / H710p recusou-se a inicializar discos que não fossem da marca DELL. Uma atualização subsequente inicializou esses discos, mas marcou a matriz "degradada". Somente atualizações de firmware relativamente recentes (final de 2013) corrigiram essa situação precária.
  3. Mantenha o cache privado do seu disco ativado. Algumas placas RAID desativam forçosamente o cache privado do disco. Isso diminui o desempenho do SSD no nível do consumidor, pois eles usam muito o cache DRAM privado para armazenar em cache sua tabela de indireção e mascarar a latência pesada envolvida na exclusão / programação do MLC NAND. Por exemplo, uma unidade Crucial M550 de 240GB, muito rápida, grava a uma taxa incrivelmente lenta de 5 MB / S quando seu cache interno está desativado.
  4. Se possível, favorece fortemente os discos com proteção COMPLETA contra perda de energia. Isso se aplica diretamente ao campeão corporativo, mas, como afirmado acima, há discos relativamente baratos nesse campeão.
  5. Se nenhum SSD protegido contra perda de energia estiver em sua lista de lojas, use pelo menos um disco com perda de energia parcial para proteção de dados em repouso. Alguns drivers excelentes com essa proteção são o Crucial / Micron M500 / M550 e o mais recente M600. A Micron ainda tem um documento interessante sobre como / por que aprovisionar seu M600unidade para uso em ambiente de virtualização. De qualquer forma, lembre-se de que, com unidades protegidas contra perda total de energia, permanece uma pequena possibilidade de perder / corromper seus dados. Quão pequeno? depende do comportamento do controlador RAID (por exemplo, se ele emitir um comando final de liberação do ATA após a transferência de dados para um disco habilitado para cache) e do firmware do disco, portanto, não é possível fornecer uma resposta detalhada. O que posso dizer é que, em todos os meus testes, as placas PERC RAID parecem sempre liberar o cache privado do disco (se estiver ativado)
  6. Provisione fortemente suas unidades de consumo , pelo menos com uma capacidade reservada de 25/30%.
  7. Não use unidades consumidoras de segunda classe. Até bons drivers de consumidor têm seus problemas, e usar um disco de consumidor de nível inferior está causando problemas.
shodanshok
fonte
5

A inconsistência de desempenho dos SSDs dos consumidores pode causar problemas em alguns controladores RAID, os picos na latência de E / S são exacerbados ao usar um controlador RAID, pois muitas vezes ele não usa TRIM (não conheço nenhum controlador que faça isso). As unidades corporativas são projetadas com base em desempenho consistente, mesmo sem o TRIM, de modo que elas geralmente funcionam bem com os controladores RAID.

Se você não precisar de alta resistência, existem SSDs corporativos de baixa qualidade projetados para ciclos de leitura alta e baixa gravação. Intel S3500 ou Samsung 845DC oferecem SSDs baratos, mas compatíveis com controladores de ataque.

No entanto, se você estiver usando controladores dell / hp raid, tenha cuidado com a compatibilidade. Na minha experiência, a HP é a pior quando se trata de unidades não-hp com seus controladores e, às vezes, não apresenta informações de monitoramento sobre as unidades.

user300497
fonte
5

O motivo para usar equipamentos de nível empresarial é a confiabilidade mais que a velocidade. A maioria dos SSDs de consumo é MLC, sendo o mais baixo o TLC (o MLC faz 2 bits por célula, o TLC faz 3, e eles têm menos desempenho e são confiáveis ​​que o SLC). Em algum momento, eles também podem reduzir o cache de ram integrado para economizar custos, à medida que as células nand ficam mais baratas. Um SSD corporativo também possui maior redundância incorporada com mais chips nand de reposição

O mais novo, mais lento, teoricamente menos confiável do TLC tem um MBTF mais baixo. Você gostaria de ir para unidades MLC

Quanto à confiabilidade, é um saco misto. Você tem resistência a colisões físicas na cabeça, com certeza, mas os controladores podem morrer. A resistência da unidade melhorou significativamente .

Considere algumas coisas - todas as unidades morrem. Se for importante, é absolutamente necessário fazer backup. Considere isso como armazenamento nearline e leve em consideração a confiabilidade.

Se você está procurando resistência, um SSD moderno e sofisticado para consumidores (como o samsung 850 pro) tem uma resistência bastante decente. Os 850 profissionais classificados para 150-300 tb de gravações (em comparação com 73 tb no modelo mais antigo e 7300 a 14600 tb nos modelos mais recentes). Você pode trocar espaço por resistência e resistência jogando com espaço livre. Os SSDs corporativos vêm com mais espaço livre, portanto, se uma célula ou chip SSD se desgastar, ele poderá se ajustar.

Muitas unidades de consumo não permitem ler quando a resistência de gravação falha. Uma grande marca faz isso, mas não me lembro qual.

Edit: Recentemente, um 'bug do kernel do linux' com SSDs da Samsung foi relatado em geral, os discos rígidos de nível empresarial são chatos, tecnologia antiga confiável . Discos rígidos de consumo, acho que um pouco menos. Alguns dos bugs estão sendo eliminados - e há mudanças acontecendo, como o nvme se tornando mais comum. Esteja preparado para testar seus SSDs antes de confirmar qualquer coisa crítica. Este parece ser um caso único, mas pode ser você!

Journeyman Geek
fonte
-1

Se isso importa, RAID 1. Eu preferiria ter dois SSDs baratos para consumidores no RAID 1 do que o melhor SSD corporativo. O par deve usar aproximadamente na mesma taxa, mas, além do desgaste, é extremamente improvável que falhem ao mesmo tempo. Você deve ter RAM suficiente para limitar drasticamente a paginação, para poder colocar seu sistema e programas em um disco rígido e, em seguida, colocar seus bancos de dados no par SSD. Como os discos rígidos são baratos, você também pode pagar com RAID 1. Fora de um incêndio, essa configuração protegerá seus dados e proporcionará excelente desempenho. Em seguida, você pode fazer backup na nuvem e encerrar o dia.

rarquimedes
fonte
5
Os SSDs corporativos possuem um capacitor integrado para proteção contra perda repentina de energia. Os SSDs dos consumidores não apenas carecem disso, mas também mentem para os controladores RAID sobre a liberação correta de buffers voláteis, tornando-os vulneráveis ​​à perda de dados, mesmo em configurações RAID altamente redundantes.
Joel Coel