Erros de hardware da CPU no Ubuntu 17.04

12

Alguém pode me explicar o que essas mensagens de erro recebi quando procurei no dmesg? Eu sou novo no Ubuntu e no mundo Linux.

[ 7.802351] CPU4: Core temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802352] CPU0: Core temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802353] CPU5: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802354] CPU0: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802354] CPU4: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802356] CPU1: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802356] mce: [Hardware Error]: Machine check events logged
[ 7.802362] mce: [Hardware Error]: CPU 4: Machine Check: 0 Bank 128: 00000000880a0003
[ 7.802363] mce: [Hardware Error]: TSC 99561677c
[ 7.802385] mce: [Hardware Error]: PROCESSOR 0:506e3 TIME 1501537538 SOCKET 0 APIC 1 microcode ba
[ 7.802387] mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 128: 00000000880a0003
[ 7.802387] mce: [Hardware Error]: TSC 995616be4
[ 7.802388] mce: [Hardware Error]: PROCESSOR 0:506e3 TIME 1501537538 SOCKET 0 APIC 0 microcode ba
[ 7.802389] CPU2: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802390] CPU6: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802391] CPU3: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802392] CPU7: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.826359] CPU4: Core temperature/speed normal
[ 7.826359] CPU0: Core temperature/speed normal
[ 7.826360] CPU2: Package temperature/speed normal
[ 7.826361] CPU6: Package temperature/speed normal
[ 7.826361] CPU0: Package temperature/speed normal
[ 7.826362] CPU4: Package temperature/speed normal
[ 7.826363] mce: [Hardware Error]: Machine check events logged
[ 7.826367] mce: [Hardware Error]: CPU 4: Machine Check: 0 Bank 128: 00000000880b0002
[ 7.826368] mce: [Hardware Error]: TSC 99916f004
[ 7.826369] mce: [Hardware Error]: PROCESSOR 0:506e3 TIME 1501537538 SOCKET 0 APIC 1 microcode ba
[ 7.826369] mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 128: 00000000880b0002
[ 7.826370] mce: [Hardware Error]: TSC 99916f2ca
[ 7.826370] mce: [Hardware Error]: PROCESSOR 0:506e3 TIME 1501537538 SOCKET 0 APIC 0 microcode ba
[ 7.826400] CPU1: Package temperature/speed normal
[ 7.826401] CPU5: Package temperature/speed normal
[ 7.826402] CPU3: Package temperature/speed normal
[ 7.826402] CPU7: Package temperature/speed normal
[ 467.922330] CPU4: Core temperature above threshold, cpu clock throttled (total events = 73)
[ 467.922331] CPU0: Core temperature above threshold, cpu clock throttled (total events = 73)
[ 467.922332] CPU7: Package temperature above threshold, cpu clock throttled (total events = 86)
[ 467.922333] CPU3: Package temperature above threshold, cpu clock throttled 

Estou executando o Ubuntu 17.04 com o kernal 4.10.0-29-generic

M.Voyles
fonte
ou é um bug de software eu tenho o mesmo no meu log de um novo Lenovo T480S ver bugs.launchpad.net/ubuntu/+source/linux/+bug/1781924
Rolf Schumacher

Respostas:

8

A CPU está superaquecendo e entrando no MCE (eventos de verificação da máquina) ... ou seja: está travando. Se você não vir outros eventos relacionados à temperatura no syslog, provavelmente é porque o cooler / ventilador / tubo térmico / pasta térmica da CPU não está fazendo o trabalho.

  • Verifique syslog com este terminalcomando ...

    grep -i -e temp -e therm /var/log/syslog*
    
  • Se a máquina estiver muito suja / empoeirada, isso poderá desempenhar um papel importante no superaquecimento da máquina. Limpe-o.

  • Se sua máquina possui processadores Intel, verifique se ela intel-microcodeestá instalada.

    sudo apt-get update
    sudo apt-get install intel-microcode
    reboot
    
  • Instale thermaldpara tentar controlar a temperatura.

    sudo apt-get update
    sudo apt-get install thermald
    reboot
    
  • Verifique sua versão do BIOS. Digite seu BIOS na hora de ligar e anote a versão #. Vá para o site do fabricante com a marca / modelo do seu computador. Vá para a seção de suporte / downloads e verifique se há um BIOS mais novo.

  • Por fim, e muito provavelmente, se for uma máquina mais antiga, o composto térmico que fica entre os processadores e seu tubo de calor / ventilador deve ser reaplicado. Isso requer alguma experiência técnica.

heynnema
fonte
11
Qual o impacto que isso intel-micorocodetem na temperatura?
gene_wood
@gene_wood como mencionei, provavelmente é um problema de poeira, ventilador ou composto térmico, e a verificação do microcódigo é apenas mais uma etapa para ajudar a diagnosticar o problema remotamente. A execução do microcódigo antigo da CPU pode causar vários problemas. Segundos para verificar.
Heynnema # 8/18