Como interpretar atributos SMART?

5

Quero estimar a saúde e a vida útil restante do meu disco rígido usando o SMART (no meu caso gsmartcontrol). No entanto, não sei como interpretar os atributos. Mais especificamente:

  • Quais atributos são mais importantes para essas estimativas?
  • como interpretar os valores brutos: quão altos ou baixos são permitidos os valores brutos para um determinado disco rígido (por exemplo, no meu caso, um WD scorpio black)
  • existem tabelas do fabricante onde eu possa comparar os valores atuais com alguns limites?

Como você interpretaria os valores brutos atuais do meu escorpião preto WD, como mostrado abaixo, com relação à saúde e ao tempo de vida restante? (Eu uso a unidade há 3 anos regularmente, não vou alterar o padrão de uso).

Esperto

aluna
fonte

Respostas:

8

Primeiro, eis o que posso dizer sobre a saúde do seu disco:

  • Seu disco rígido não apresenta sinais de falha iminente (0 setores realocados / pendentes, sem problemas de rotação, com o cabo SATA etc.) e os atributos "ruins, mas não letais" são geralmente 0s)
  • Seu laptop sofreu um número razoável de batidas durante a operação (o G-Sense + Free Fall Protection é razoavelmente alto)
  • Seu disco rígido é executado a uma temperatura razoavelmente média para uma unidade de laptop (embora isso dependa de quanta carga estava quando você tirou este relatório)

Algumas pesquisas conduzidas pelo Google indicam que é mais provável que as unidades falhem nos primeiros 6 meses, principalmente se estiverem sendo usadas com muita força. Como sua unidade sobreviveu três anos sem nenhum sinal de falha, é provável que continue funcionando bem. Isso não significa que você não deve manter backups, apenas no caso ;-)

Além disso, tente evitar bater no seu laptop enquanto ele estiver ligado e evite pegá-lo até desligá-lo - Isso pode ter algo a ver com as altas contagens de erros de Proteção contra quedas livres e G-Sense da sua unidade. Sua unidade possui recursos de detecção de choque (algumas unidades não reportam e sempre reportam 0s, mesmo se sacudidas durante a execução), portanto, tentam estacionar as cabeças da unidade quando detectar movimento. Obviamente, ele não matou sua unidade, mas uma batida particularmente forte na hora errada poderia, por isso tentará estacionar as cabeças da unidade quando detectar movimento, fazer com que as cabeças da unidade batam e danifiquem os pratos.

E algumas curiosidades e suposições:

  • Você é bastante móvel com seu laptop e provavelmente o usa em movimento (devido ao número considerável de contagens G-Sense e Free Fall Protection - elas seriam próximas de 0 para um laptop usado em uma mesa e desligado enquanto se movia )
  • Seu laptop está em pelo menos um terço do tempo (Horas de ligação = um ano de uso contínuo, você diz que a unidade tem 3 anos)
  • Você liga e desliga o laptop várias vezes ao dia (com base na contagem do ciclo de energia em comparação com a idade da unidade)
  • Parece que o seu laptop não possui todas as opções de economia de energia ativadas (com base no ciclo de carga / descarga comparado à contagem do ciclo de energia e nas horas de vôo em comparação às horas de ligado)
  • Seu disco rígido gravou aproximadamente 120 TB de dados e leu 866 TB de dados (com base no total de LBAs gravados e lidos)

Quais atributos são os mais importantes?

O atributo mais importante em termos de taxas de falha é a contagem do setor realocado. Se for um número maior que 0, sua unidade terá muitas vezes mais chances de falhar. O outro atributo importante é a Contagem de setores pendentes atuais (posteriormente podem se transformar em setores realocados). Se um desses valores for maior que 1, substitua sua unidade o mais rápido possível. (fonte: trabalho de pesquisa do Google)

Uma contagem de erros UDMA CRC particularmente ruim pode mostrar que o cabo SATA precisa ser substituído. (fonte: experiência pessoal)

Como interpretar os valores brutos

Os valores brutos diferem de fabricante para fabricante. No caso da Western Digital, a maioria dos números costuma ser a frequência com que a condição específica ocorreu. As unidades da Seagate armazenam alguns números de maneira diferente, o que resulta em valores brutos muito altos para alguns atributos. Dado isso, para muitos valores (que não sejam contagem de setor realocado e contagem pendente e outros valores brutos de contagem óbvia), faz mais sentido olhar para o valor normativo - a unidade apresenta os valores normatizados, não o programa, então é o que a unidade considera normal.

Existem tabelas do fabricante em que eu possa comparar os valores atuais com alguns limites?

Geralmente, se o valor normalizado (ou pior) de um atributo atingir o limite ou o valor mais baixo, a unidade estará pronta. (Os valores normalizados pioram à medida que se aproximam de zero.)

Os discos rígidos também possuem folhas de especificações, que listam quantos ciclos de inicialização / parada um disco é classificado, entre outras coisas.

William Lawn Stewart
fonte
Boa resposta. Você poderia dar mais detalhes sobre como conseguiu entender os parâmetros SMART da lista de declarações sobre o disco rígido, por exemplo, "O laptop dele está em pelo menos um terço do tempo". Graças
bbaja42
@ bbaja42 Eu adicionei algumas explicações sobre a forma como cheguei a essas conclusões =)
William Lawn Stewart
1

OK, eu sei que esse tópico é bastante antigo, mas aqui meus 2 centavos:

(Sou novo aqui, não posso responder como comentário)

Horas de voo principal 40858023897390 => TO HEX: 0x2529 0000 292E

4 bytes mais baixos 0x292E = 10.541 energia em horas (como visto abaixo)

maior 4 bytes 0x2529 = ??? (milissegundos talvez? o número sobe e desce sem mudar de hora, talvez esteja no complemento de dois binários ou não tenha relação com o tempo)

e sobre o total de LBAs r / w ... parece ser exatamente isso.

Información de SMART para Disco 1
SEAGATE 2 TB

Modelo:     ST2000DM001-1CH164
Número de serie:    Z1E5716J
Firmware:   CC27

Atributo SMART

Tiempo de giro  0
Contador de inicio/parada   32
Contador de sectores recolocados    0
Horas de encendido         10541   (POWER ON HOURS)
Contador de reintento de giro   0
Contador de reinicio    32
Runtime Bad Block   1
End-to-End Error    0
Reported Uncorrect  0
Command Timeout 0
High Fly Writes 3
Airflow Temperature Cel 41
G-Sense Error Rate  0
Contador de retracción de apagado   20
Contador de ciclo de carga  32
Temperatura en grados Celsius   41
Sector actualmente pendiente    0
No corregibles sin conexión 0
Contador de error CRC de UDMA   0
Head Flying Hours   40858023897390
Total LBAs Written  93750333994
Total LBAs Read 69405426987
Contador de errores ATA 0
Hernexto
fonte