Por que os discos rígidos falham?

8

Estou interessado nas razões pelas quais ocorrem falhas no disco rígido. Algumas pessoas dizem que é porque foi mal manuseada durante os processos de remessa e transporte, enquanto outras dizem que é devido ao calor / uso intenso e prolongado, mas ouvi até alguém dizer que é por causa da poeira.

Qual é a resposta e a causa mais prováveis ​​de falhas no disco rígido?

JFW
fonte

Respostas:

9

Há um bom resumo aqui .

Os motivos incluem:

  • Acidente de cabeça, onde a cabeça de leitura e gravação toca um prato.
  • Filtro de ar defeituoso, permitindo que o pó caia no prato
  • Falha real dos componentes eletrônicos do controlador.
  • Falha mecânica ou peças desgastadas

Portanto, ser batido durante o transporte é uma possível razão para falhas no disco, e o uso prolongado em condições intensas causará desgaste nas peças mecânicas e a entrada de poeira também pode causar uma falha.

A causa mais provável de uma falha no disco, se o disco não estiver com defeito de alguma forma, está apenas ficando desgastado.

Richard Holloway
fonte
7

Algumas causas de falha no disco rígido incluem:

  • manuseio inadequado, por exemplo, impacto, eletricidade estática
  • vibração
  • alta aceleração
  • sobretensão / sobretensão
  • poeira ou outro material em particular, por exemplo, limalhas de metal
  • mudanças rápidas de temperatura - acho que a EMC diz mais de 10 ° C por hora de mudança de temperatura - mas verifique com seu fornecedor
  • alta temperatura comum, por exemplo, temperatura ambiente acima de 45 graus C ou mais - consulte o seu fornecedor
  • antigamente, os drivers de buggy, mas hoje em dia, acredito que os travamentos físicos / de firmware tendem a impedir isso - embora eu acredite que ocasionalmente tenha sido lançado um firmware de buggy que causou problemas de falha na unidade.
  • componentes defeituosos / outro defeito de fabricação

Você pode achar este documento interessante: http://labs.google.com/papers/disk_failures.pdf Basicamente, o Google Sysadmin / SRE fez uma pesquisa sobre falhas de unidade em uma grande população de unidades (por exemplo, os data centers do google).

Jason Tan
fonte
Fiquei surpreso ao saber que, aparentemente, uma unidade mais fria (abaixo de 37 ° C) durará mais que uma unidade mais quente, de acordo com esse artigo .
David Cary
1

Firmware com bug: sim, como velociraptores. sendo mordido por essa coisa estúpida no momento. Tem que mudar o firmware em uma dúzia de unidades.

TomTom
fonte
Eu tenho um monte de unidades WD que não funcionam, a menos que estejam conectadas ao modelo de controlador específico que as configura para esperar / sem necessidade de energia. WD irá substituí-los porque, aparentemente, foi um bug no firmware da unidade, síndrome de Estocolmo? ^^
Oskar Duveborn
Não tenho certeza. Velociraptores estúpidos desligam a cada 49.x dias por alguns segundos - meu controlador RAID os odeia. Corrigido há muito tempo. Obter a atualização da WD foi pior do que obter um cabo extra. Tivemos que colocar advogados no link antes que eles admitissem que a correção existia.
TomTom