Problemas no disco rígido - SpinRite vs. SMART

8

O disco rígido da Toshiba em um laptop Sony VAIO deu errado. Coloquei uma unidade Western Digital (WD1600BEVS-60RST0, firmware v4.01G04) de um laptop HP. Corri o SpinRite no nível 2 e encontrei alguns setores defeituosos, mas parecia recuperar dados e marcar. Executei o SpinRite no nível 5 e demorou aproximadamente 30 horas, mas terminou limpo - sem relatos de problemas.

No entanto, quando inicializo, recebo um erro SMART inespecífico dizendo algo com o efeito de "a falha da unidade é iminente!" Então, estou um pouco confuso - o SpinRite disse: "tudo de bom!", Mas a SMART está dizendo " Perigo, Will Robinson! ". Em quem eu confio? O que está acontecendo? O que a SMART sabe que o SpinRite não?

Peter Mortensen
fonte

Respostas:

7

Se o SpinRite não estiver lendo os próprios parâmetros SMART, é possível que haja lotes.

Os valores SMART (Tecnologia de automonitoramento, análise e geração de relatórios) são um conjunto de variáveis ​​rastreadas pelo próprio inversor em relação a muitas coisas, desde contagens relacionadas à idade geral (tempo ligado, número de inicializações durante a vida útil, ...), básicas monitoramento de funcionamento (número de erros recuperáveis ​​recuperados, duração do tempo de rotação, número de setores remapeados devido a erro recuperável repetido, número de blocos reservados restantes para esse remapeamento, temperatura atual, temperatura máxima histórica, ...), bem como indicadores explícitos de falhas (número de erros irrecuperáveis ​​encontrados, número de falhas nos autotestes anteriores, ...). A maioria desses contadores / sinalizadores possui uma referência associada acima / abaixo da qual o inversor começa a se considerar na saída.

Enquanto o SpinRite removeu os dados desses setores desonestos e os marcou no sistema de arquivos para que eles não sejam usados ​​novamente, a unidade não sabe disso. Tudo o que sabe é que há mais erros irrecuperáveis ​​em seu estado salvo do que está satisfeito e, presumivelmente, outros indicadores menos graves de que sua condição está ruim e / ou em declínio, e quando o BIOS lê isso, ele avisa.

O inversor conhece sua própria condição melhor do que o SpinRite. Sugiro que você siga o aviso e o substitua o mais rápido possível, caso o problema que causou os setores defeituosos piore. Pode não piorar (pode ter havido uma imperfeição muito pequena na superfície de uma das travessas e tudo o mais está bom), mas se você tiver algum dado sobre o qual se importa, pode correr o risco?

Uma ressalva: seu BIOS pode não estar lendo os indicadores SMART corretamente, mas como você realmente viu setores defeituosos relatados no nível do sistema operacional / aplicativo, duvido que seja esse o caso, por isso pode valer a pena pegar algum software para analisá-los você mesmo . Existem muitos utilitários disponíveis para digitalizar e exibir parâmetros SMART de suas unidades - você pode até encontrar um específico para o fabricante (que pode incluir melhores descrições de métricas que não são comuns / padrão - o SMART permite que métricas específicas do fabricante / modelo sejam armazenados e lidos) fornecidos no site.

David Spillett
fonte
3

Uma unidade SMART possui muitos indicadores de status , alguns dos quais indicam falha iminente da unidade. Qualquer unidade que indique o status de falha do SMART deve ser substituída o mais rápido possível. Obviamente, você pode continuar usando a unidade até que ela falhe (possivelmente dias ou meses no futuro), mas não diga que não foi avisado.

O sistema SMART não é infalível ... Só recebi avisos SMART avançados em duas unidades (em cerca de 10.). Mas ambos falharam duas semanas após o aviso SMART.

Chris Nava
fonte
2

A SMART conhece as temperaturas.
A SpinRite conhece os setores.

Portanto, o disco está aquecendo acima do limite que o seu software SMART está definido para detectar como erro. Quando persistentemente tive esse problema durante um verão particularmente quente, eu, como solução, redefinii esse limite para uma temperatura mais alta, que ainda estava bem dentro da faixa de temperatura do fabricante.

Se esta solução não lhe parecer correta, ou se a temperatura do disco estiver perigosamente próxima do limite superior do fabricante (considero isso em 10 graus), seu disco está falhando.

Mas repito, é mais provável que seja uma configuração muito sensível para o seu software SMART. De qualquer forma, de acordo com o SpinRite, seu disco ainda não começou a falhar.

Mas não economize nos seus backups!

harrymc
fonte
1

Eu confiaria no SpinRite até certo ponto, se ele verificou e reescreveu toda a superfície do disco. Mas você realmente deve usar algo como Smartmontools para descobrir qual parâmetro SMART está acionando o alerta.

Pode ser que a quantidade de blocos defeituosos realocados seja muito alta ou qualquer um dos outros indicadores de "pré-falha" de "velhice" seja muito alto. O SpinRite não pode redefinir esses indicadores; portanto, o estado geral de SMART continuará reclamando.

O estado do disco pode ser mantido por algum tempo se o uso completo do SpinRite não encontrar mais erros, mas você deve continuar executando o SpinRite, porque ele também atualiza os blocos com um ECC ruim, mas corrigível . Ou apenas obtenha um novo disco ;-)

robcast
fonte