O SMART é inteligente de usar?

16

Alguns anos atrás, disseram-me para evitar o SMART como uma praga. O raciocínio era que o estresse que os testes colocam na unidade realmente fará com que ela falhe.

Ainda é esse o caso? Caso contrário, qual é a frequência razoável para executar testes? Se eu ainda deveria evitá-lo, qual é a melhor maneira de monitorar a saúde dos meus discos rígidos?

Prumo
fonte

Respostas:

30

Embora o SMART certamente não preveja todas as falhas, trabalhei em uma oficina de computadores por vários anos, e muitas vezes uma mensagem de erro SMART foi a primeira indicação de que uma falha estava prestes a ocorrer, permitindo que eu salvasse os dados do cliente antes da unidade morreu.

A tecnologia em si não enfatiza a unidade, apenas acompanha vários indicadores (lista completa aqui: http://en.wikipedia.org/wiki/SMART .) Que podem levar a falhas na unidade, como:

  • Taxa de erro de leitura
  • Contagem de setores reatribuídos
  • Contagem de Novas Tentativas de Rotação
  • Contagem de setores incorrigível
  • Power on Hours

O impacto no desempenho do SMART é insignificante, não estressa as unidades (o monitoramento é passivo) e pode avisá-lo de que você está prestes a perder todas as fotos de seus filhos (ou sua coleção de MP3 ou o que for importante no seu disco rígido) )

Em resumo, deixe-o ligado.

Sean Earp
fonte
Acho que o pôster original foi informado sobre o perigo de testes ativos de superfície que podem ser realizados pelo SMART (executando testes "longos" manualmente). O barramento, como você diz, por padrão, o SMART é passivo e deve estar sempre ativado. Pessoalmente, também executo testes ativos uma vez por mês em minhas unidades.
Colas Nahaboo 27/05/09
3

Além de registrar passivamente contadores e eventos de desempenho, o SMART fornece uma interface para iniciar vários tipos de autotestes realizados pelo inversor e obter seus resultados posteriormente.

Alguns desses testes envolvem a varredura de toda a superfície do prato enquanto permanecem on-line e respondem a solicitações do host; portanto, a E / S pesada causa muita debulha.

Eu acho que o último é a fonte do grave equívoco que você foi informado. SMART é legal.

NekojiruSou
fonte
-6

Há algum tempo, o Google fez um estudo (PDF) " Tendências de falhas em uma população grande de unidades de disco ". Eles têm toneladas de unidades que usam e o estudo mostrou:

Nossa análise identifica vários parâmetros do SMART (mecanismo de auto monitoramento) do inversor que se correlacionam altamente com as falhas. Apesar dessa alta correlação, concluímos que é improvável que os modelos baseados apenas nos parâmetros SMART sejam úteis para prever falhas de unidades individuais. Surpreendentemente, descobrimos que os níveis de temperatura e atividade estavam muito menos correlacionados com falhas no inversor do que o relatado anteriormente.

Portanto, a temperatura é um fator muito maior do que o estresse no inversor. Além disso, com toda a correção de erros que acontece nessas novas unidades o tempo todo, é adicionado muito mais estresse que você não tem controle. Se você estiver procurando por uma ferramenta para fornecer manutenção (ou recuperação) em suas unidades, eu recomendaria o SpinRite . É de Steve Gibson e é um produto incrível.

Bernie Perez
fonte
3
Sua referência não diz que a temperatura não está correlacionada para causar falhas? ... mas você considera isso um "fator muito maior"? Por favor, esclareça o que você quer dizer #
Michael Haren
Estou lendo isso errado? Ele diz que a temperatura não está fortemente correlacionada com a falha da unidade, certo? Nem é atividade de acordo com esse papel.
MrChrister
11
"Portanto, a temperatura é um fator muito maior do que o estresse no acionamento". - De onde você conclui isso? O parágrafo que você citou disse que a temperatura não estava altamente correlacionada.
9788 Joe Phillips #
3
-1 por falhar não apenas em ler corretamente o resumo do artigo, mas por falhar em reservar um tempo para ler a coisa toda. Geralmente, a falha na unidade é atribuída a um defeito de fabricação (como mostra a Figura 3: o alto uso nos primeiros 3 meses elimina os erros dos componentes - depois que a falha devido ao uso começa a convergir) ou a degradação ao longo do tempo. Degradação ao longo do tempo é o que a SMART detectará. A Figura 5 mostra que a temperatura não é um fator importante - de fato, o relatório sugere que unidades mais frias têm mais mudanças de falha do que aquelas que ficam quentes, certamente nos primeiros 3 anos.
315 de Ian