Eu tenho um disco em um software de dois discos RAID-1 para o qual recentemente um "setor incorrigível offline" apareceu no status SMART.
198 Offline_Uncorrectable 0x0030 200 200 000 Old_age Offline - 1
Aparentemente, isso é apenas um sinal de falha iminente do disco, se ocorrer com mais frequência (e, como a unidade é espelhada, também não há grande risco de perda real de dados). Na época, um autoteste também falhou em algum momento e smartd
me enviou um e-mail para me notificar sobre isso, como é óbvio.
No entanto, gravar no setor danificado geralmente faz com que o disco use um de seus setores sobressalentes, em vez disso, aparentemente porque, desde que eu dd
editei o disco, todos os autotestes foram executados com perfeição. E badblocks
também não encontrou motivo para reclamar.
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
[...]
# 5 Extended offline Completed without error 00% 5559 -
# 6 Short offline Completed without error 00% 5540 -
# 7 Short offline Completed: read failure 90% 5524 63273368
O número de setores defeituosos não diminuiu, o que não deveria, na verdade, já que o setor quebrado ainda está lá, embora não seja usado. No entanto, smartd
continua a me enviar e-mails todas as noites:
The following warning/error was logged by the smartd daemon:
Device: /dev/sda [SAT], 1 Offline uncorrectable sectors
Isso é extremamente irritante, obviamente, e entorpece meu saudável reflexo de pânico nos e- smartd
mails.
O disco é um WD20EARS da Western Digital e a smartd
versão é 5.41 2011-06-09 r3365.
fonte
-U 198+
deve fazê-lo. Bom achado!existem duas possibilidades de onde esses e-mails vêm. O smartd é capaz de enviar e-mails por si só, mas provavelmente não está configurado dessa maneira, portanto, presumo que esses e-mails sejam enviados por verificação de log. Se essa suposição estiver errada, você não precisará ler mais.
O logcheck verifica os arquivos de log e envia e-mails se achar que você deve se preocupar com o que aconteceu com / no seu sistema.
Você tem a opção de escrever uma regra de ignorar a verificação de log que diz ao logcheck para não enviar mensagens que correspondam a um padrão específico.
Você pode (em sistemas baseados no Debian) criar um arquivo chamado "/etc/logcheck/ignore.d.server/smartd_own" com o seguinte conteúdo:
Isso deve filtrar os e-mails irritantes, mas gravá-lo novamente se o contador de setores incorrigíveis aumentar.
fonte
smartd
envia as mensagens diretamente, infelizmente. Aparentemente, é sempre uma opção para mudar isso. Vou considerar isso se não houver outro caminho, então obrigado!