As unidades SSD são tão confiáveis ​​quanto as unidades mecânicas (2013)?

162

As unidades SSD existem há vários anos. Mas a questão da confiabilidade ainda surge.

Eu acho que esse é um acompanhamento desta pergunta postada há 4 anos e atualizada pela última vez em 2011. Agora é 2013, mudou muito? Acho que estou procurando alguma evidência real, mais do que apenas um pressentimento. Talvez você os esteja usando no seu controlador de domínio. Qual tem sido sua experiência?

Confiabilidade de unidades ssd


ATUALIZAR:

Agora é 2016. Acho que a resposta provavelmente é sim (pena que ainda custem mais por GB).

Este relatório fornece algumas evidências:

Confiabilidade instantânea na produção: o esperado e o inesperado

E alguns dados interessantes sobre unidades mecânicas (de consumo):

Backblaze: Estatísticas e dados do disco rígido

Matt
fonte
2
Por que você diz que o problema de confiabilidade ainda aparece?
Ewwhite 14/05
6
O SSD do laptop da minha esposa para de funcionar a cada poucos meses e requer uma correção estranha de "ligar, mas não tente inicializar por vinte minutos". Então está tudo bem novamente. Nova tecnologia, novas maneiras de falhar.
Jaydee
3
Só um ponto de dados, receio: comprei um MacBook Retina Pro em setembro do ano passado e tive uma falha terminal do SSD em 60 dias. A unidade de substituição está boa, mas agora estou muito cautelosa com isso simplesmente porque a substituição / atualização do usuário não é realmente uma opção.
Roddy #
27
Você não quer uma unidade confiável de qualquer maneira. Se falhar às 14:00 todos os dias, você poderá confiar nele para ajustar o relógio. O que você quer é uma unidade resiliente.
Alan B
3
Os SSDs existem há muito mais tempo do que "há vários anos". Mais do que 40, na verdade, e mesmo se você quiser dizer SSDs baseados em Flash, estamos falando há 20 anos.
Alastair

Respostas:

175

Isso será uma função da sua carga de trabalho e da classe de unidade que você compra ...

Nas implantações de servidor, não tive uma falha no SSD com a especificação adequada. Isso ocorre em muitos tipos diferentes de unidades, aplicativos e cargas de trabalho.

Lembre-se, nem todos os SSDs são iguais !!

Então, o que significa "especificação adequada" ?

Se sua pergunta é sobre o uso de SSD em aplicativos corporativos e de servidor, um pouco mudou nos últimos anos desde a pergunta original . Aqui estão algumas coisas a considerar:

  • Identifique seu caso de uso: Existem unidades de consumo, unidades corporativas e até SSDs de aplicativos industriais robustos . Não compre um disco barato para uso em desktop e execute um banco de dados com muita gravação.

  • Muitos fatores de forma estão disponíveis: Os SSDs de hoje podem ser encontrados nas placas PCIe, SATA e SAS de 1,8 ", 2,5", 3,5 "e outras variantes.

  • Use o RAID para seus servidores: você não dependeria de uma única unidade mecânica em uma situação de servidor. Por que você faria o mesmo com um SSD?

  • Composição da unidade: Existem SSDs baseados em DRAM, bem como os tipos de flash MLC, eMLC e SLC. Estes últimos têm vida útil finita, mas são bem definidos pelo fabricante. por exemplo, você verá limites diários de gravação como 5 TB / dia por 3 anos .

  • O aplicativo é importante: Algumas unidades são para uso geral, enquanto outras são otimizadas para leitura ou gravação. As unidades baseadas em DRAM, como o sTec ZeusRAM e o DDRDrive , não se desgastam. Eles são ideais para ambientes de alta gravação e discos frontais mais lentos. As unidades MLC tendem a ser maiores e otimizadas para leituras. As unidades SLC têm uma vida útil melhor do que as unidades MLC, mas a MLC corporativa realmente parece ser boa o suficiente para a maioria dos cenários.

  • O TRIM parece não ter importância: os controladores RAID de hardware ainda não o suportam totalmente . E na maioria das vezes eu uso SSDs, ele estará em uma configuração de RAID de hardware. Não é algo que me preocupe nas minhas instalações. Talvez eu deva?

  • Resistência: o excesso de provisionamento é comum nos SSDs da classe de servidor. Às vezes, isso pode ser feito no nível do firmware ou apenas particionando a unidade da maneira certa. Os algoritmos de nível de desgaste também são melhores em todos os aspectos. Algumas unidades até relatam estatísticas de vida útil e resistência. Por exemplo, alguns dos meus SSDs corporativos Sandisk da marca HP são exibidos 98% life remainingapós dois anos de uso.

  • Os preços caíram consideravelmente: os SSDs atingiram o preço certo: taxa de desempenho para muitas aplicações. Quando o desempenho é realmente necessário, é raro o padrão para unidades mecânicas agora.

  • Reputações foram solidificadas: por exemplo, a Intel é segura, mas não de alto desempenho. OCZ não é confiável. As unidades baseadas no Sandforce são boas. O sTec / STEC é extremamente sólido e é o OEM de muitas unidades de array de alta qualidade. Sandisk / Pliant é semelhante. A OWC possui ótimas soluções SSD com uma excelente garantia para servidores de baixo impacto e para implantação de estação de trabalho / laptop.

  • A proteção contra perda de energia é importante: observe as unidades com supercapacitores / supercaps para lidar com gravações excelentes durante eventos de energia. Algumas unidades aumentam o desempenho com caches internos ou os utilizam para reduzir o desgaste. As supercaps garantem que essas gravações sejam liberadas para armazenamento estável.

  • Soluções híbridas: Os fornecedores de controladores RAID de hardware oferecem a capacidade de aumentar as matrizes de disco padrão com SSDs para acelerar leituras / gravações ou servir como cache inteligente. A LSI possui o CacheCade e suas ofertas de hardware / software Nytro . Também existem soluções de software e no nível do SO para fornecer cache local em aplicativos, bancos de dados ou sistemas de hipervisor. Sistemas de arquivos avançados como o ZFS fazem uso muito inteligente de SSDs de leitura e gravação otimizados; O ZFS pode ser configurado para usar dispositivos separados para armazenamento em cache secundário e para o log de intenção, e os SSDs são frequentemente usados ​​nessa capacidade, mesmo para pools de HDD.

  • Chegou o flash de primeira linha: as soluções de flash PCIe, como o FusionIO , amadureceram a ponto de as organizações se sentirem confortáveis ​​ao implantar aplicativos críticos que dependem do desempenho aprimorado . As soluções de eletrodomésticos e SAN, como RanSan e Violin Memory, ainda estão por aí, com mais participantes entrando nesse espaço.

insira a descrição da imagem aqui

ewwhite
fonte
12
O TRIM é realmente importante em unidades com muito pouco provisionamento em excesso, o que é comum em unidades de consumo em que os US $ / GB são importantes. A maioria das unidades corporativas possui provisionamento em excesso suficiente para que o TRIM não faça nenhuma diferença.
Sr. Alpha
2
@MisterSmith Veja o que escrevi acima. SSDs diferentes têm características diferentes. Use a ferramenta certa para o trabalho. Se eu pegasse uma Corsair ou outra unidade no nível do consumidor e a usasse como um SSD para um sistema de banco de dados com muita gravação ativa ou como o dispositivo de log ZIL para uma matriz de armazenamento ZFS, eu a queimaria em um mês ou dois .
ewwhite 14/05
1
Excelente post. Uma das minhas preocupações: controladores RAID nem sempre são a escolha certa com SSDs. Os controladores RAID foram projetados para distribuir dados e adicionar códigos de correção de erros em vários discos magnéticos. Os controladores SSD já distribuem dados de forma nativa e adicionam códigos de correção de erros em vários bancos da NVRAM. Além disso, a adição de um controlador RAID apresenta um SPOF extra, o próprio controlador RAID. O uso de um controlador RAID separado geralmente é a escolha certa, mas às vezes o uso de um SSD melhor (SATA / SAS de nível superior ou até placas PCI-E como Fusion-IO) é uma escolha melhor .
Jesper Mortensen
5
@rickyduck, na verdade, em um data center, uma única falha de unidade é protegida por RAID, e significa gastar alguns $$$ para substituí-lo sem tempo de inatividade; enquanto que em uma plataforma de jogos, uma falha no disco único é a perda total de dados e a reinstalação do SO.
2
O @MisterSmith, mesmo os SSDs de desktop de última geração, são mais baratos por GB do que os direcionados aos usos típicos de data centers. Além de controladores mais poderosos em alguns casos (ou apenas firmware de baixo volume ajustado para taxa de transferência em vez de desempenho de burst), eles obtêm o melhor flash extraído da parte superior da execução da produção, porque muitas cargas de trabalho do servidor têm ordens de magnitude mais intensivas em E / S do que os desktops unidades e rapidamente mataria uma unidade consumidora.
Dan Neely 14/05
59

Todos os laptops do meu trabalho têm SSDs ou híbridos desde 2009. Em resumo, minha experiência com SSDs:

  • O que chamarei de unidades de "1ª geração", vendidas por volta de 2009 principalmente:
    • No primeiro ano, cerca de 1/4 morreu, quase todos da Síndrome da Morte Súbita (SSD - É engraçado, risos). Isso foi muito perceptível para os usuários finais e irritante, mas a drástica diferença de velocidade tornou esse padrão de falha constante tolerável.
    • Após 3 anos, todas as unidades morreram (morte súbita ou desgaste), exceto duas que ainda estão chutando (atualmente, unidades L2Arc em um servidor).
  • As unidades de "segunda geração", vendidas entre 2010 e 11, são distintas da geração anterior, pois as taxas de Síndrome de morte súbita caíram drasticamente. No entanto, o "problema" de desgaste continuou.
    • Após o primeiro ano, a maioria das unidades ainda funcionava. Houve algumas mortes repentinas. Um casal falhou devido ao desgaste.
    • Após 2-3 anos, mais da metade ainda está funcionando. A taxa de falha do primeiro ano continuou essencialmente.
  • As unidades "3rd Gen", vendidas em 2012 ou mais, ainda estão funcionando.
    • Após o primeiro ano, tudo ainda funciona (bata na madeira).
    • A unidade mais antiga que adquiri é de março de 2012, portanto ainda não há dados de 2 a 3 anos.

Falha no SSD (cumulativa)


Atualização de maio de 2014:
Algumas das unidades de "2ª geração" falharam, mas cerca de um terço das unidades originais ainda está funcionando. Todas as unidades "3rd Gen" do gráfico acima ainda estão funcionando (bata na madeira). Já ouvi histórias semelhantes de outras pessoas, mas elas ainda carregam o mesmo aviso sobre a morte em asas rápidas . O vigilante manterá seus dados bem armazenados em backup.

Chris S
fonte
2
Minha experiência ecoa isso. Dito isso, ainda fornecemos discos rígidos USB para os funcionários usarem como backups de máquinas do tempo (além do nosso regime de backup externo padrão), para permitir restaurações rápidas e granulares em caso de falha ou perda catastrófica.
EEAA
22
Dê à terceira geração outro ano ou dois. ;)
Andy
7
Também vale a pena notar que os SSDs são muito mais propensos a sofrer de bugs de firmware do que os HDDs; o firmware é mais complicado e menos maduro, o que não é uma boa combinação.
Alastair
2
@ Andy está certo. A partir de 2009, você diz que a meia-vida foi de cerca de um ano. No período de 2010 a 2011, estamos com apenas 3 anos no meio desse intervalo agora, onde você indica uma meia-vida de 3 anos. Isso só pode ser baseado em observações atuais. Se a meia-vida das unidades de 2012 e 2013 melhorou além de três anos não pode ser realmente conhecida até pelo menos 2016. (Poderíamos tentar extrapolar as falhas iniciais, mas essas provavelmente seriam apenas defeitos de fabricação isolados, não causados ​​por longos períodos. uso regular a longo prazo.)
Andrew Vit
1
Eu uso 2 x Intel X25M 80Gb G1 desde 2010. Meu trabalho envolve processos pesados ​​de leitura / gravação. A cada poucos meses, redefino a unidade (não preciso) para recuperar o desempenho, mas sem problemas. Adicionei um Samsung 230Gb de 256Gb no ano passado. Sem problemas até agora!
Antillar Maximus
18

Na minha experiência, o verdadeiro problema são os controladores que estão morrendo, e não a própria memória flash. Instalei cerca de 10 SSDs da Samsung (830, 840 [não profissional]) e nenhum deles causou problemas até agora. O oposto total são as unidades com controladores Sandforce, tive vários problemas com as unidades de agilidade da OCZ, especialmente congela em intervalos de tempo irregulares, em que a unidade para de funcionar até desligar / ligar o computador. Eu posso lhe dar dois conselhos:

  1. Se você precisar de alta confiabilidade, escolha uma unidade com MLC, melhor flash SLC. Samsung 840 fe tem flash TLC, e uma garantia curta, acho que não sem qualquer motivo;)

  2. Escolha uma unidade com um controlador conhecido por ser estável.

klingt.net
fonte
Lembra-me dos controladores moribundos na iluminação atual baseada em LED. O LED dura muito tempo, mas os controladores não parecem.
Matt
1
Quem sabe, mas talvez seja parte de indústrias obsolescência planejada :)
klingt.net
11

O www.hardware.fr, um dos maiores sites de notícias sobre hardware da França, é parceiro do www.ldlc.com, um dos maiores revendedores online da França. Eles têm acesso às estatísticas de retorno e publicam relatórios de taxa de falhas (placas-mãe, fontes de alimentação, RAM, placas gráficas, HDD, SSD, ...) duas vezes por ano desde 2009.

Estas são estatísticas de "morte prematura", de 6 meses a 1 ano de uso. Também não podem ser contados os retornos diretos ao fabricante, mas a maioria das pessoas retorna ao revendedor durante o primeiro ano e isso não deve afetar as comparações entre marcas e modelos.

De um modo geral, as taxas de falha do disco rígido têm menos variações entre marcas e modelos. A regra é maior capacidade> mais pratos> maior taxa de falhas, mas nada dramático.

No geral, a taxa de falhas do SSD é mais baixa, mas alguns modelos de SSD foram realmente ruins, com retornos de cerca de 50% para os infames durante o período solicitado (2013). Parece ter parado agora que a infame marca foi comprada.

Algumas marcas de SSD estão "otimizando" seu firmware apenas para obter resultados um pouco mais altos em benchmarks e, às vezes, você acaba com congelamentos, telas azuis, ... Isso também parece ser menos problemático agora do que em 2013.

Os relatórios de taxa de falhas estão disponíveis:
2010
2011 (1)
2011 (2)
2012 (1)
2012 (2)
2013 (1)
2013 (2)
2014 (1)
2014 (2)
2015 (1)
2015 (2)
2016 (1) )
2016 (2)

Sacha K
fonte
Aqui está um link para uma versão traduzida automaticamente do artigo em francês translate.googleusercontent.com/…
SDwarfs