Como depurar congelamentos irrecuperáveis ​​frequentes?

9

Meu novo XPS 13 (9360 com processador KabyLake) com o Ubuntu 16.04 pré-instalado frequentemente congela completamente sem motivo aparente.

Os congelamentos ocorrem aparentemente aleatoriamente. Às vezes, o ponteiro do mouse ainda pode ser movido por alguns segundos, mas eventualmente o sistema trava completamente. Não consigo mudar para terminais virtuais e nem mesmo os códigos SysRq parecem ter algum efeito. Tudo o que posso fazer é pressionar e pressionar o botão liga / desliga para desligá-lo com força, após o qual o sistema é inicializado normalmente.

Os processos do usuário em execução são principalmente várias guias do Chrome e um terminal.

As coisas que verifiquei e tentei incluem:

Depois disso, os congelamentos ainda ocorrem. Agora estou perdida. Minha pergunta é assim:

Quais são as maneiras de encontrar a causa do problema?

justfortherec
fonte
Isso soa como um bug do cstate que existia com as CPUs Bay-Trail. Eu acho que vale a pena tentar a correção também. Reinicie sua máquina até ver as grubopções de inicialização. Clique epara exibir as opções da linha de comando. Em seguida, adicione intel_idle.max_cstate=1logo após as palavras quiet splashe inicialize. Veja se isso funciona. Pode ser necessário registrar um erro no Launchpad. Que kernel você está usando?
Negusp
@PatrickNegus Isto é com o kernel 4.4.0-47-genérico. Há uma opção de BIOS para desativar os estados C. Isso faz essencialmente a mesma coisa? Vou tentar editar a linha de comando. Com "um bug cstate que existia com a CPU Bay-Trail", você quer dizer um bug do kernel ou um hardware? Vale a pena tentar novos kernels da linha principal?
justfortherec
O Kernel 4.8 tem suporte muito, muito melhor para o Kaby Lake que o 4.4. Então, sim, atualize. Em relação ao bug Bay-Trail, era e ainda é um bug do kernel que impede o Ubuntu de gerenciar com eficácia os estados de suspensão da CPU (que economizam energia para a CPU e oferecem uma eficiência ociosa muito melhor).
Negusp
Obrigado pela sua ajuda, @PatrickNegus. Apenas para verificar se queremos dizer a mesma coisa. Você quer dizer atualizar para o kernel 16.10 como descrito em askubuntu.com/a/840184/63018 ?
justfortherec
Sim, foi o que eu quis dizer.
Negusp

Respostas:

4

Desative intel_cstates(os estados de economia de energia destinados a reduzir o calor residual da CPU e o uso de energia) editando /etc/default/grub:

sudo nano /etc/default/grub

Encontre a linha que contém GRUB_CMDLINE_LINUX_DEFAULT="quiet splash"

Adicione intel_idle.max_cstate=1diretamente a seguir splash.

Como alternativa, se o seu BIOS suportar isso, desative os referidos estados C a partir daí.

Nota: essa não é uma correção de longo prazo. A desativação dos estados C aumenta consideravelmente o consumo de energia e o desperdício de calor. Apenas tente isso se não houver outras soluções e a atualização do seu kernel não resolve nada!

negusp
fonte
por que exatamente isso ajudaria?
Korijn 01/06/19
@Korijn ... já faz um tempo, mas houve (ou possivelmente foi resolvido) um erro nas CPUs Intel Bay Trail, nas quais há instabilidade significativa no sistema quando os estados de economia de energia estão ativados. Desativar estados-c corrige o erro.
Negusp
3

Como instalar o Kernel 4.8.5

Embora 4.8.7 seja o kernel mais recente, neste registro de bugs de 500 postagens e 1 ano de duração ( bug 109051 - intel_idle.max_cstate = 1 necessário no baytrail para evitar falhas ), é relatado que não funciona. Ontem mesmo alguém postou que tentou o 4.8.7, ele travou e voltou para o 4.8.6.

Embora o título do registro de erros seja "Bay Trail", as soluções apresentadas se aplicam a outras plataformas Intel, conforme relatado pelos usuários. Como existem 582 postagens em quase um ano, recomendo pressionar a Endtecla após abrir o link e rolar para cima a partir daí.

Estou executando o 4.8.5 repetidamente, juntamente com o 4.4.0-47, há algumas semanas e me sinto confortável usando qualquer um deles. Estas são as instruções para instalar a versão 4.8.5 do kernel:

cd /tmp
wget http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.8.5/linux-headers-4.8.5-040805_4.8.5-040805.201610280434_all.deb
wget http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.8.5/linux-headers-4.8.5-040805-generic_4.8.5-040805.201610280434_amd64.deb
wget http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.8.5/linux-image-4.8.5-040805-generic_4.8.5-040805.201610280434_amd64.deb
sudo dpkg -i *.deb
sudo reboot

Você pode instalar qualquer kernel visitando o site: ( http://kernel.ubuntu.com/~kernel-ppa/mainline/ ) e adaptando os links para as instruções acima.

WinEunuuchs2Unix
fonte
Obrigado pela informação. No entanto, não vou aceitá-lo como resposta a este tópico, porque ele aborda uma pergunta que levantei no comentário, não a pergunta original deste tópico.
justfortherec
De fato. Deixe-me saber se você tentar um novo kernel e se funcionar.
WinEunuuchs2Unix
2
Meu sistema parou de congelar aleatoriamente após a atualização para qualquer kernel 4.8 que eu tentei (LTS 4.8.0-25.27~16.04.1e linha principal 4.8.12-040812.201612020431).
justfortherec