Verifique se há erros no disco rígido / sinais de falha no CentOS Server

14

Qual é a melhor maneira de verificar se há erros no disco rígido e sinais precoces de falha no CentOS?

inac
fonte
1
qual a frequência das verificações? diariamente semanalmente?
inac

Respostas:

3

Eu recomendaria instalar o smartmon ( http://sourceforge.net/apps/trac/smartmontools/wiki ) em sua máquina. Este é um software que pode verificar a integridade de seus discos, caso contrário, ele estará verificando / var / log / messages ou / var / log / syslog para qualquer menção de erros scsi

Paulo
fonte
O smartmon parece que, embora suas estatísticas mencionem que capturaria apenas 60% das unidades com falha. Se eu configurasse o smartmon para verificar diariamente, isso realmente ajudaria o disco rígido a morrer mais rápido - é um Seagate 7200.10?
INAC
O @inac smartmon ajudará os HDDs a morrerem mais rápido? Onde você leu isso? Por favor, adicione um URL.
030
2
dmesg

O kernel registrará qualquer mensagem de diagnóstico sobre dispositivos de E / S, para que você possa verificar essas mensagens com o comando dmesg.

Banjer
fonte
mas você teria que executar este manualmente ou cronjob dmesg dump para vi?
inac
ou. você pode criar um script para despejá-lo com "dmesg> dmesg.dump.txt" e executá-lo diariamente com cron.
Banjer
1

Você pode executar o fsck no dispositivo para verificar se há erros.

cdated
fonte
0

Como Paul diz, os logs SMART são um bom lugar para verificar.

Eu também recomendo executar o BadBlocks . Se você possui uma placa RAID, pode ser necessário usar o monitoramento.

Dentrasi
fonte
0

O monitoramento SMART é uma boa maneira. Como root, smartctl -a /dev/hdaonde hda é a unidade que você deseja ... pode ser hdb, sda, etc.

Essa é uma resposta muito vaga, no entanto. Se você possui um servidor fabricado por qualquer um dos grandes fabricantes (Dell, HP, etc), é provável que haja melhores recursos de monitoramento disponíveis.

churnd
fonte
0

Você pode tentar a verificação completa da partição / dev / sda1 (por exemplo) como

fsck -f /dev/sda1

ou tente o teste não descritivo completo de leitura e gravação de determinada partição

badblocks -vn /dev/sda1
Liibo
fonte
/dev/sda1 is mounted; it's not safe to run badblocks!
030
e2fsck: Cannot continue, aborting.
030
@ 030 Largue para um nível de execução em que o disco principal não está montado.
awiebe