Estou executando o Arch Linux mais recente no meu laptop ThinkPad t420 e estou tendo um problema intermitente de calor, onde minha temperatura aumentará dos ~ 45 ° C para ~ 75-90 ° C e permanecerá lá até eu reiniciar.
Já corri várias ferramentas de diagnóstico, incluindo o óbvio htop
e outros que googling sugeriu, inclusive powertop
, iostats
e, certamente, outros que eu não lembro. Até agora, não encontrei problemas óbvios e, aparentemente, nenhuma diferença nas leituras, se minha máquina está funcionando normalmente ou nesse estado quente.
Também matei a maioria dos processos suspeitos, um por um (bancos de dados e outros daemons), esperando encontrar o culpado oculto, sem sucesso.
Além dessas tentativas, não sei por onde começar a solução de problemas . Espero que alguém possa me indicar a direção certa para começar a procurar a questão mais profunda.
Para ser preciso, minha pergunta não é como resfriar minha máquina, mas o que poderia causar uma mudança de calor consistente de mais de 30 graus em um sistema em que (supostamente) a CPU e a carga são normais? E quais ferramentas / práticas eu poderia usar para diagnosticá-lo?
Algumas notas que podem ser úteis:
- I pode resfriar o sistema (por exemplo, desengatando o controle do ventilador completamente), mas imediatamente se aquece novamente se deixado sozinho. Isso parece sugerir que a retenção de calor não é um problema, mas algo gera continuamente calor.
- O uso e a carga da CPU são relatados
htop
normalmente após entrar nesse estado quente. Isso inclui threads do kernel. De acordo comhtop
, o sistema está essencialmente ocioso (1-2% de uso da CPU no sistema, uma carga de 0,10). - Minha máquina usa gráficos integrados Intel HD e não possui outra placa gráfica . Uma placa nVidia era uma opção para esse modelo, conforme observado por @braiam; Eu não optei por isso.
- @terdon trouxe as configurações do governador da CPU. Minhas CPUs estão definidas como
powersave
- Meu processador específico é um Core i7-2620M de 2,7 GHz.
Edit : No momento em que escrevi essa pergunta, meu controle de fãs não estava funcionando corretamente e funcionava continuamente em um intervalo médio de RPM (3900 RPMs), mesmo em temperaturas altas. Por sugestão de @Alex e @JustDanyul, isso foi corrigido. O problema subjacente, no entanto, ainda permanece.
fonte
Respostas:
O fã
O meu também faz isso, executando o Fedora 14. Tente pegar uma lata de ar comprimido e soprar as aberturas de ventilação na parte traseira e lateral do gabinete.
Periodicamente, você também deseja remover o teclado e soprar ar comprimido diretamente nas pás do ventilador. Eles ficam cobertos de poeira e começam a afetar sua eficácia pesando-a.
A melhor coisa sobre os Thinkpads são os manuais de serviço! Eles mostram como derrubar o laptop e montá-lo novamente.
Mau processo
A outra coisa que notei é que ocasionalmente terei um processo que deu errado e consumirei 100% de um dos núcleos. Mate esse processo normalmente traz a temperatura de volta ao normal.
Você pode usar
htop
outop
para ver qual é esse processo e matá-lo a partir deles ou de um terminal usando-oPID
.o quê mais?
Veja minha resposta a estas perguntas e respostas sobre questões de questões e respostas para obter mais dicas sobre como obter leituras de temperatura para os vários componentes do seu laptop. As perguntas e respostas são intituladas: Como obter a temperatura central dos núcleos haswell i7 no i3status .
fonte
top
comando você pode pressionar "1" para ver a carga de núcleos individuais.Este é um comentário mais longo, mas você deve dar uma olhada no thinkwiki.org, que é o recurso para Linux no ThinkPads. Quanto à temperatura, tive problemas semelhantes com o meu t4500 e resolvi-o jogando com
O governador da CPU que controla o dimensionamento da frequência da CPU. Suas escolhas são:
Com ondemand , sua CPU só será executada na velocidade mais alta quando necessário. Idealmente, isso será completamente transparente para você, sua máquina simplesmente funcionará o mais rápido possível para as tarefas atuais. Para ativá-lo, faça
Controle do ventilador. Existe um utilitário muito bom chamado " Simple ThinkPad Fan Control ", que permite ajustar as temperaturas do gatilho que alteram a velocidade do ventilador. Também dê uma olhada nas informações aqui .
fonte
powersave
Eu acho que há um problema sobre o que você considera "quente". Para o Thinkpad t420 (de acordo com os fóruns ) é de cerca de 80 a 85 ° C e vamos esquecer a placa nVidia que também pode causar um aumento de temperatura (na verdade, a configuração do Optimus pode não funcionar bem, forçando sua CPU a fazer o trabalho da GPU). Isso digamos, o seu máximo CPU temperatura tolerada é 100C (se ele fica lá o sistema será desligado), enquanto o ambiente é de cerca de 10,0 ° C a 35,0 ° C . Dito isto, se o seu laptop estiver dentro do limite, tudo está ok (exceto a duração da vida útil da bateria e do laptop).
Agora você queria apontar possíveis suspeitos. Nesse aspecto, eu diria que a má implementação da nVidia com Linux pode gerar trabalho em sua CPU que não será exibido no htop (ou em qualquer outro lugar) devido ao seu infame sistema On Demand On-Demand Optimus, que parece se adequar à sua situação atual ( funciona bem até um momento, apenas começa a aquecer sem controle). Você deve atualizar sua instalação até ter o Bumblebee totalmente configurado. Você pode usar o
bbswitch
para desabilitar o cartão nVidia à vontade e ver como ele funciona.Para instalar o Bumblebee for Arch, você pode encontrar o pacote no repositório. Se você ainda não o instalou.
fonte
Mesmo com temperatura como ~ 75-90 ° C?
Então, um problema é apenas que a velocidade do ventilador não está funcionando automaticamente?
Esqueça o automóvel, você pode ler a temperatura corretamente e pode controlar a velocidade do ventilador manualmente, certo? Nesse caso, tudo o que você precisa fazer é encontrar um script de controle de ventilador funcionando ou implementar o seu próprio (pesquise a temperatura e defina a velocidade de acordo com a tabela
temp[i]=speed[i]
, quando você definir uma velocidade mais alta, mantenha-a por um tempo, mesmo que a temperatura caia , quando precisar diminuir a velocidade, faça-o lentamente e passo a passo).Sobre a pesquisa, o melhor seria ter um daemon de monitor de temperatura que desencadeie eventos de mudança térmica e o script de controle do ventilador ouvindo / aguardando esses eventos, embora eu (talvez errado), uma vez que era,
acpid
mas atualmente não sei.Nos dois casos (seu próprio / script existente), enquanto você não estiver confiante com a solução, observe sempre a temperatura e as RPMs, o ventilador não deve parar.
Resolva esse
auto
problema primeiro e, se o superaquecimento persistir, você pode se concentrar na causa.editar
Convém tentar uma ferramenta como
lttng
coletar estatísticas de todo o sistema ao longo do tempo, mas pode não ser fácil de configurar e pode ser caro em termos de armazenamento, se você precisar coletar por um longo período.fonte
Como aumentar o ventilador manualmente resolve o problema, este seria um excelente local para iniciar a solução de problemas, pois isso sugere que o controle automático do ventilador não está funcionando.
Agora, você roda o arch linux, que é uma distro brilhante (sim, eu também corro) com um ótimo wiki. Então, eu tenho que perguntar, você RTFM? ; p
https://wiki.archlinux.org/index.php/Lenovo_ThinkPad_T420#Fans
Tanto quanto eu posso ver, você precisa:
Tudo isso foi feito?
ATUALIZAÇÃO Fico feliz em saber que seu fã agora está funcionando corretamente, em vez de apenas girar em um ambiente feliz. (Acho que isso resolveu o problema da sua máquina funcionando a temperaturas acima de 80 graus?)
No que diz respeito a responder qual é a causa subjacente de uma mudança de temperatura de 30 graus, estou tentada a perguntar: não poderia ser por causa do fato de que seu ventilador não estava funcionando corretamente?
Vamos postular que,
Não seria seguro supor que talvez não houvesse nenhum problema, e que o problema era simplesmente o fato de o seu fã estar rodando em um nível em que ele mal conseguia lidar? E pequenas mudanças na temperatura ambiente, etc, colocá-lo acima do limite de suas capacidades?
Por exemplo, eu tinha um laptop Acer e, em dias quentes, o ventilador estava "constantemente" girando para cima e para baixo. Aposto que se meu fã não fosse capaz de se ajustar, eu também teria visto grandes variações de temperatura :)
fonte