Como acessar os valores SMART ao usar RAID e Intel Matrix Storage?

17

Temos uma matriz RAID 5 usando o Intel Matrix Storage (ou seja, um RAID baseado na placa-mãe). Um dos discos rígidos começou a emitir ruídos e a matriz está sendo reconstruída.

Gostaríamos de interrogar os valores SMART nas unidades da Seagate, mas por algum motivo, nenhum dos programas que tentamos conseguiu ler os valores SMART.

Existe alguma técnica para ler os valores SMART para que possamos saber qual unidade está em suas últimas pernas?

Contango
fonte
Quais programas você tentou?
digitxp
HDDlife e AShampoo HDD Control. Acho que o problema é que todas as unidades aparecem como uma unidade grande com 6 GB de tamanho (seu RAID 5). É quase como se precisássemos de algo para ignorar o controlador RAID e espiar diretamente no próprio controlador de disco rígido para descobrir qual disco rígido está em suas últimas pernas.
Contango
A maioria do software de diagnóstico Smartctl para Windows suporta a leitura do smartctl dos discos rígidos atrás da matriz de ataque.
Trevor Boyd Smith

Respostas:

4

Se o Intel Matrix Storage Manager não falar sobre o status da unidade (SMART), talvez (ou também) use o utilitário Seatools (inicializável) da Seagate para diagnosticar as unidades da Seagate.

Você simplesmente precisa definir o BIOS de 'RAID' para 'IDE', e as unidades devem estar visíveis como unidades individuais na mídia inicializável do Seatools.

Depois de usá-lo para diagnosticar a unidade, ligue o RAID novamente no BIOS e você deve estar do jeito que estava (a configuração do RAID permanecerá). Nesse ponto, você pode planejar trocar a unidade defeituosa (se necessário).

Ƭᴇcʜιᴇ007
fonte
2
Obrigado, bom saber que isso é possível. Eu ficaria um pouco hesitante em tentar isso - essas matrizes RAID são tão frágeis que, se você ligar o computador com uma das unidades desconectadas, aguarde 30 segundos, conecte a unidade novamente e ligue-a novamente. deseja fazer uma reconstrução completa, que leva 10 horas. Isso deve ser totalmente desnecessário, pois a unidade nunca foi gravada.
Contango 9/09
18

Na minha breve leitura, parece que esse pode ser um problema comum com esse controlador . Tente dar uma chance aos smartmontools . É suposto ter algum suporte experimental para o controlador Matrix.

04-02-2011: adicionamos suporte experimental para discos atrás do driver Intel Matrix RAID no Windows. Informe os resultados do seu teste à lista de discussão do suporte do smartmontools.

Use /dev/csmi0,Xcomo um nome de dispositivo para acessar informações SMART de discos individuais, por exemplo:

smartctl.exe -a / dev / csmi0,0

OldWolf
fonte
Tentei o suporte experimental, não parecia funcionar. Obrigado pela dica, pelo menos.
Contango 29/10
1
Trabalhou para mim, Intel Matrix Storage Console 8.9.2.1002, ICH10 chipset, smartmontools 5.43-0-20120-0620-r3567
ChrisWue
+1 Trabalhou para mim, smartctl 5.43 2012-06-30 r3573chipset Intel P67 Express (6 Series PCH), iaStor.sys v 10.1.0.1008 (06/11/2010) (Intel Rapid Storage Technology).
Jonathon Reinhart
Minha matriz é para dados (não para SO), então tive que usar /dev/csmi0,1etc, para outros discos. Obrigado. +1
Felipe Alvarez
14

O hddguardian funciona muito bem com o controlador Intel Matrix RAID, essencialmente é uma GUI para smartctl.

Erus
fonte
Este é um vencedor para mim. Argus monitor foi ok, mas hddguardian dá informações muito compreensível sobre todos os dados e limiares
nevster
Também funciona para meus HDDs conectados através do "Adaptador LSI, SAS3 3008 Fury -StorPort". Portanto, outros controladores RAID também podem ser suportados.
i3v
funciona para mim também. raid 0 ssd evo ty para nome do software
MonsterMMORPG
Parece ótimo, mas infelizmente o autor recebeu muitas queixas de assédio relatadas como "problemas" e decidiu encerrar o projeto.
jimp
3

O Argus Monitor mostra informações SMART para unidades por trás do controlador Intel Matrix RAID:

Versão 1.8.17 (01/06/2011): Suporte para controladores Intel Matrix RAID (chipsets ICHx).

haimg
fonte
1

smartmontools funcionou bem para mim.

Eu tenho uma placa-mãe Asus com controlador RAID Intel ICH10R. Dois dos HDs estão em uma configuração RAID-1 e outros 2 são de configuração regular não-RAID. Eu posso consultar qualquer um deles com smartmontools.

A interface da linha de comando é bastante fácil de usar e pode ser script facilmente.

c:\>smartctl --scan
/dev/sda -d scsi # /dev/sda, SCSI device
/dev/sdb -d scsi # /dev/sdb, SCSI device
/dev/sdc -d scsi # /dev/sdc, SCSI device
/dev/csmi0,0 -d ata # /dev/csmi0,0, ATA device
/dev/csmi0,2 -d ata # /dev/csmi0,2, ATA device
/dev/csmi0,3 -d ata # /dev/csmi0,3, ATA device
/dev/csmi0,4 -d ata # /dev/csmi0,4, ATA device
/dev/csmi0,5 -d ata # /dev/csmi0,5, ATA device

Isso mostra a lista de dispositivos detectados. No meu caso, os dispositivos 5 / dev / csmi0, x correspondem às várias portas SATA na placa-mãe.

Você pode consultar qualquer um deles facilmente:

c:\>smartctl -a /dev/csmi0,2
smartctl 6.3 2014-07-26 r3976 [x86_64-w64-mingw32-win7-sp1] (sf-6.3-1)
Copyright (C) 2002-14, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     SAMSUNG SpinPoint F2 EG
Device Model:     SAMSUNG HD154UI
Serial Number:    XXXXXXXXXXXXXX
LU WWN Device Id: X XXXXXX XXXXXXXXX
Firmware Version: 1AG01118
User Capacity:    1,500,301,910,016 bytes [1.50 TB]
Sector Size:      512 bytes logical/physical
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ATA/ATAPI-7, ATA8-ACS T13/1699-D revision 3b
Local Time is:    Thu Apr 16 21:59:25 2015 PDT
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
...

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   100   100   015    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0007   070   070   007    Pre-fail  Always       -       9700
  4 Start_Stop_Count        0x0032   098   098   050    Old_age   Always       -       2506
  5 Reallocated_Sector_Ct   0x0033   100   100   051    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   100   100   015    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0025   100   100   037    Pre-fail  Offline      -       0
  9 Power_On_Hours          0x0032   097   097   050    Old_age   Always       -       14655
 10 Spin_Retry_Count        0x0033   100   100   051    Pre-fail  Always       -       0
 11 Calibration_Retry_Count 0x0012   100   100   018    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   098   098   050    Old_age   Always       -       2500
 13 Read_Soft_Error_Rate    0x000e   100   100   014    Old_age   Always       -       0
183 Runtime_Bad_Block       0x0032   100   100   050    Old_age   Always       -       0
184 End-to-End_Error        0x0033   100   100   051    Pre-fail  Always       -       0
187 Reported_Uncorrect      0x0032   100   100   050    Old_age   Always       -       2
188 Command_Timeout         0x0032   100   100   050    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   067   061   034    Old_age   Always       -       33 (Min/Max 13/33)
194 Temperature_Celsius     0x0022   065   060   034    Old_age   Always       -       35 (Min/Max 13/35)
195 Hardware_ECC_Recovered  0x001a   100   100   026    Old_age   Always       -       767683535
196 Reallocated_Event_Count 0x0032   100   100   050    Old_age   Always       -       0
197 Current_Pending_Sector  0x0012   100   100   018    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   100   048    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   100   100   062    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x000a   100   099   010    Old_age   Always       -       3
201 Soft_Read_Error_Rate    0x000a   100   100   010    Old_age   Always       -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

Os IDs 5 e 198 são de particular interesse. Houve um interesse no estudo do Google que indicou que eles são bons indicadores de quando a unidade está prestes a falhar.

raychi
fonte
1

As ferramentas smartmon funcionaram para mim também, mas apenas para as unidades espelhadas. Não iria ler os dados do meu Intel SSD ... a Intel SSD Toolbox faz isso.

  • Placa-mãe Intel BX58SO
  • Firmware / BIOS RAID 1 (espelhado)
  • Drives: Seagate ST3500320NS
  • SO: Windows 10 de 64 bits

Também descobri que o software AIDA64 (anteriormente Everest) funciona. Mais fácil de ler do que dados brutos, mas essa ferramenta não é gratuita. Lê os dados SMART dos SSD e dos spinners espelhados

Como outros observaram, vale a pena ler o artigo da WikiPedia no SMART.

Kelly Smith
fonte