Syslogd: erro de hardware

1

A máquina tem enviado essas mensagens para o terminal, emparelhado com sinais sonoros do alto-falante na placa-mãe. Essas mensagens aparecem a cada 5 minutos, às vezes, nomeando CPU2, algumas vezes CPU3.

Mensagem de syslogd @ pc em mar 25 17:52:20 ...   kernel: [7200.792043] [Erro de hardware]: CPU: 2 MC0_STATUS [- | CE | - | - | AddrV | CECC]: 0x9467400000000136

Mensagem de syslogd @ pc em mar 25 17:52:20 ...   kernel: [7200.792059] [Erro de hardware]: MC0_ADDR: 0x00000001f5925200

Mensagem de syslogd @ pc em mar 25 17:52:20 ...   kernel: [7200.792065] [Erro de hardware]: Erro de cache de dados: durante o preenchimento de linha L1 de L2.

Mensagem de syslogd @ pc em mar 25 17:52:20 ...   kernel: [7200.792073] [Erro de hardware]: nível de cache: L2, tx: DATA, mem-tx: DRD

Mensagem de syslogd @ pc em mar 25 17:52:20 ...   kernel: [7200.792085] [Erro de hardware]: CPU: 2 MC1_STATUS [- | CE | - | - | AddrV]: 0x9400000000000151

Mensagem de syslogd @ pc em mar 25 17:52:20 ...   kernel: [7200.792093] [Erro de hardware]: MC1_ADDR: 0x00000000004aa210

Mensagem de syslogd @ pc em mar 25 17:52:20 ...   kernel: [7200.792098] [Erro de Hardware]: Erro de Cache de Instrução: Erro de paridade durante o carregamento de dados.

Mensagem de syslogd @ pc em mar 25 17:52:20 ...   kernel: [7200.792105] [Erro de hardware]: nível de cache: L1, tx: INSN, mem-tx: IRD

Mensagem de syslogd @ pc em mar 25 17:52:20 ...   kernel: [7200.792115] [Erro de Hardware]: CPU: 2 MC2_STATUS [Acima | CE | - | - | AddrV | CECC]: 0xd40041000000010a

Mensagem de syslogd @ pc em mar 25 17:52:20 ...   kernel: [7200.792124] [Erro de hardware]: MC2_ADDR: 0x00000001d4fe5200

Mensagem de syslogd @ pc em mar 25 17:52:20 ...   kernel: [7200.792129] [Erro de hardware]: Erro de unidade de barramento: paridade GEN / erro de ECC durante o acesso a dados de L2.

Mensagem de syslogd @ pc em mar 25 17:52:20 ...   kernel: [7200.792137] [Erro de hardware]: nível de cache: L2, tx: GEN, mem-tx: GEN

O sistema tem uma velocidade de clock padrão AMD Phenom II x4 955. BIOS está atualizado (exceto para uma versão beta). O sistema é executado na versão mais recente do Linux Mint Debian Edition. Temps estão no limite superior, mas ainda são aceitáveis ​​(~ 45 graus ociosos).

Eu testei o sistema com o memtest86 + por 15 horas (5 passagens), assim como o prime95 para um total de 24 horas. Nenhum erro foi relatado por qualquer um deles e o sistema é estável. Estranhamente, nenhuma mensagem do syslogd apareceu durante a execução do prime95. O Windows não relata erros no log de eventos, mas eu não estou no Windows há tempo suficiente para ter certeza disso. Eu entendo que as CPUs raramente quebram, mas talvez este seja um dos casos mais raros? Existe um problema em apenas desabilitar as mensagens do syslogd, pois não há problemas que eu possa detectar? Se não, qual é o próximo?

SillySyslogd
fonte
Tente correr cpuburn. Talvez isso ajude a reduzir o problema. E instalar mcelog para ajudar a ler e decodificar eventos de exceção de verificação de máquina.
jpe
Estou tendo alguns problemas para fazer o mcelog funcionar. Eu iniciei o daemon, os erros continuam ocorrendo a cada 5 minutos, mas mcelog --client não reporta nada, e / var / log / mcelog está praticamente vazio exceto por uma mensagem sobre um prefill falho do banco de dados DIMM que não é problema de acordo para o faq do mcelog, e uma mensagem que o daemon já está rodando.
SillySyslogd
Está relatando uma CPU defeituosa, tente um CPU de substituição / em boas condições.
Ƭᴇcʜιᴇ007
@ techie007 Obrigado pela resposta, mas eu já sabia disso. A principal questão era saber se pode causar mal simplesmente desabilitar as mensagens, pois não há problemas com a estabilidade.
SillySyslogd
Se você confia, desative-os. Pessoalmente, eu não confiaria nisso até que eu vi uma cópia nova do mesmo sistema operacional rodando em um processador bem conhecido fazer a mesma coisa. :)
Ƭᴇcʜιᴇ007