Como fazer o smartd calar a boca sobre um setor offline incorrigível em particular?

18

Eu tenho um disco em um software de dois discos RAID-1 para o qual recentemente um "setor incorrigível offline" apareceu no status SMART.

198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       1

Aparentemente, isso é apenas um sinal de falha iminente do disco, se ocorrer com mais frequência (e, como a unidade é espelhada, também não há grande risco de perda real de dados). Na época, um autoteste também falhou em algum momento e smartdme enviou um e-mail para me notificar sobre isso, como é óbvio.

No entanto, gravar no setor danificado geralmente faz com que o disco use um de seus setores sobressalentes, em vez disso, aparentemente porque, desde que eu ddeditei o disco, todos os autotestes foram executados com perfeição. E badblockstambém não encontrou motivo para reclamar.

Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
[...]
# 5  Extended offline    Completed without error       00%      5559         -
# 6  Short offline       Completed without error       00%      5540         -
# 7  Short offline       Completed: read failure       90%      5524         63273368

O número de setores defeituosos não diminuiu, o que não deveria, na verdade, já que o setor quebrado ainda está lá, embora não seja usado. No entanto, smartdcontinua a me enviar e-mails todas as noites:

The following warning/error was logged by the smartd daemon:

Device: /dev/sda [SAT], 1 Offline uncorrectable sectors

Isso é extremamente irritante, obviamente, e entorpece meu saudável reflexo de pânico nos e- smartdmails.

O disco é um WD20EARS da Western Digital e a smartdversão é 5.41 2011-06-09 r3365.

cristão
fonte

Respostas:

23

Em alguns discos, pode ser necessário recorrer a -U 198+(ou -U +?) No arquivo de configuração.

Por favor, seja cuidadoso. Se você não é o autor original, leia a pergunta toda com atenção. Se você usá-lo em um disco que não precisa dele, suprimirá avisos totalmente válidos.

Se ´ + ´ for especificado, um relatório será impresso apenas se o número de setores tiver aumentado desde o último ciclo de verificação. Alguns discos não redefinem esse atributo quando um setor incorreto é realocado. Veja também ´-v 198, aumentando´ abaixo.

smartd.conf (5)

Por exemplo, suponha que você esteja usando a configuração padrão no smartd.conf. Nesse caso, há muitos comentários no arquivo, mas a única linha sem comentários está aqui:

# The word DEVICESCAN will cause any remaining lines in this
# configuration file to be ignored: it tells smartd to scan for all
# ATA and SCSI devices.  DEVICESCAN may be followed by any of the
# Directives listed below, which will be applied to all devices that
# are found.  Most users should comment out DEVICESCAN and explicitly
# list the devices that they wish to monitor.
DEVICESCAN

Adicione a opção ao final da linha:

DEVICESCAN -U 198+
sourcejedi
fonte
1
-U 198+deve fazê-lo. Bom achado!
Michael Hampton
algum exame para isso?
JIV 19/07
1
@JIV editado. Eu também adicionei um aviso. Por favor, tome todo o cuidado com seus dados :-).
sourcejedi 19/07
0

existem duas possibilidades de onde esses e-mails vêm. O smartd é capaz de enviar e-mails por si só, mas provavelmente não está configurado dessa maneira, portanto, presumo que esses e-mails sejam enviados por verificação de log. Se essa suposição estiver errada, você não precisará ler mais.

O logcheck verifica os arquivos de log e envia e-mails se achar que você deve se preocupar com o que aconteceu com / no seu sistema.

Você tem a opção de escrever uma regra de ignorar a verificação de log que diz ao logcheck para não enviar mensagens que correspondam a um padrão específico.

Você pode (em sistemas baseados no Debian) criar um arquivo chamado "/etc/logcheck/ignore.d.server/smartd_own" com o seguinte conteúdo:

^\w{3} [ :0-9]{11} [._[:alnum:]-]+ smartd\[[0-9]+\]: Device: /dev/sda \[SAT\], 1 Offline uncorrectable sectors$

Isso deve filtrar os e-mails irritantes, mas gravá-lo novamente se o contador de setores incorrigíveis aumentar.

hennr
fonte
smartdenvia as mensagens diretamente, infelizmente. Aparentemente, é sempre uma opção para mudar isso. Vou considerar isso se não houver outro caminho, então obrigado!
Christian
Oh caramba, de qualquer maneira você tem uma solução alternativa agora.
Hennr 17/01/13