O driver da Nvidia é instalado, mas não é carregado no ubuntu 18.04

20

O driver 384 da Nvidia funcionou bem no Ubuntu 17.04 e 17.10. Mudei para o Ubuntu 18.04 (instalação limpa e fresca) e instalei a nvidia-driver-396 seguindo esta ótima resposta

Então eu instalei o cuda toolkit 9.2 usando o arquivo .run. Falha ao instalar com e sem optar por instalar o driver nvidia junto com ele. Reiniciou e tentou novamente, e o cuda foi instalado com sucesso. Mas a nvidia não está sendo executada.

$ nvidia-settings
ERROR: NVIDIA driver is not loaded


ERROR: Unable to load info from any available system


$ nvidia-smi
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

$ lspci -v | grep VGA
00:02.0 VGA compatible controller: Intel Corporation HD Graphics 5500 (rev 09) (prog-if 00 [VGA controller])

O que eu tentei até agora:

  1. Nvidia ( nvidia-uninstall) desinstalado com êxito, mas com aviso: "Alguns links simbólicos não puderam ser removidos. Eu removi o cuda com rm -rf /usr/local/cuda*e instalei o nvidia-driver-396, mas ainda assim o mesmo erro

  2. Removido nvidia-396, instalado 396 no site da nvidia (arquivo .run). Começou com um aviso "Falha no pré-script fornecido pela distribuição". Prossegui e a instalação foi bem-sucedida. Ele também adicionou o nouveau à lista negra automaticamente. Ainda o mesmo resultado que 1.

  3. O anterior não desinstalado, a entrada da lista negra removida, instalou a nvidia-390 Ainda o mesmo resultado

  4. O anterior não desinstalado, instalou-o em "Drivers adicionais" da GUI. Nenhuma mudança.

  5. Foi para o modo de console. Gdm parado. Em seguida, instalou 396. Nenhuma alteração. Instalou 390 da mesma forma. Nenhuma mudança.

  6. Tentei usar o xorg-edgers ppa (Sim, diz-se que são iguais aos drivers de gráficos ppa, mas agora estou desesperado) Problemas de dependência não satisfeitos. Então, revertido para remover tudo.

  7. Desinstalou tudo, foi para o modo de recuperação e instalou a nvidia-driver-390. Sem sorte

  8. Eu senti que o driver da nvidia do site oficial fez algumas mudanças irrecuperáveis. Tentei instalá-lo novamente para que eu possa desinstalá-lo corretamente do modo de recuperação, conforme sugerido na ótima resposta usando a opção --unistall. Mas agora ele falha na instalação. A mensagem de erro informa que o nouveau está sendo executado, apesar de estar na lista negra. Eu removi a entrada da lista negra mais tarde

Eu tenho o Intel i5 com gráficos Intel HD junto com a Nvidia GeForce 940M . Sim, a nvidia-prime foi instalada. Inicialização dupla com o Windows 10, a Inicialização segura está desativada

Durante todas essas etapas, quando consegui iniciar o aplicativo nvidia x server, o nvidia-smi deu o mesmo erro. Houve um problema de resolução quando o cuda executou o nvidia-xconfig. Eu removi o xorg.conf para corrigi-lo. No momento, meu PC está rodando em outro dispositivo, sem outros drivers instalados, sem a lista negra da nvidia nem o xorg.conf.

Alguém pode ajudar. Não vejo nenhuma razão para que isso não funcione. É relatado que o driver nvidia 390.12 funciona bem com o kernel 4.15, mas ainda não está funcionando no meu.

sziraqui
fonte
Certifique-se de ter apenas distro em seus arquivos /etc/apt/sources.d.list/, eu tive várias distros diferentes (biônico / cósmico / xenial etc) e isso estava causando a falha
Jonathan
@ Jonathan Eu tenho apenas uma distro nesse arquivo
sziraqui

Respostas:

5

Finalmente instalou! : D

A principal causa foi o driver instalado pelo cuda toolkit. Ele nunca foi desinstalado corretamente. Então, para corrigi-lo, realizei estas operações:

  1. Desinstale todos os pacotes relacionados à nvidia e remova todas as listas negras.
  2. sudo update-initramfs -u
  3. Reiniciar
  4. Foi para o modo console (Ctrl + Alt + F3), instalou o driver Nvidia no site da Nvidia (arquivo .run)
  5. sudo update-initramfs -u
  6. Reiniciar
  7. Foi para o modo de recuperação, nvidia-uninstall
  8. # update-initramfs -u
  9. Reiniciar
  10. nvidia-driver-396Pacote instalado do graphics-drivers ppa

Tudo funcionando bem agora

Atualização: foi interrompida após uma atualização que reconstruiu o kernel e todos os módulos dkms. O problema está na compilação do módulo nvidia-drm. Se alguém tiver uma solução permanente, poste-a e atualizarei a resposta aceita

sziraqui
fonte
11
Para que eu possa entender: qual era o objetivo de instalar manualmente o driver binário e removê-lo antes de instalar o do PPA gráfico?
Alban Dericbourg
O arquivo .run fez algumas alterações desconhecidas no sistema. O script de desinstalação do arquivo .run falhou ao fazer uma desinstalação completa (todas as alterações não foram revertidas). Desinstalar roteiro era uma parte do binário de modo a usá-lo novamente no modo de recuperação eu tive que instalar o binário novamente
sziraqui
1

Obrigado @sziraqui - Finalmente tenho os drivers da Nvidia instalados no Ubuntu 18.04 com o seu conselho, juntamente com alguns outros. Aqui está o que eu tinha que fazer.

  1. Desinstalar / limpar todos os drivers Nvidia

    sudo apt-get remove --purge nvidia * && sudo apt autoremove

  2. Faça o download do driver Nvidia no site da Nvidia (arquivo .run)

  3. Desativar / driver da lista negra do Noveau https://linuxconfig.org/how-to-disable-nouveau-nvidia-driver-on-ubuntu-18-04-bionic-beaver-linux

  4. Reinicialização no modo de texto Inserindo parâmetros de inicialização do Grub - Isso pode ser feito acessando o menu grub na inicialização (pressione Esc ou Shit na inicialização) aqui, pressione e. Habilitando a inicialização no modo de texto - Adicione um respingo silencioso após 3 e pressione F10 para reiniciar usando os novos parâmetros.

  5. O gcc identificado usado para o meu kernal e definir a variável de ambiente CC ao executar o instalador da Nvidia baixado na etapa 2.

    sudo CC = gcc-7 ./[Nvidia installer .run file]

O instalador está configurado para informar que a pré-instalação falha - ignore e continue. Eu permiti à NVidia configurar o X11 e instalei as bibliotecas de 32 bits. Reiniciei e meus monitores duplos estão funcionando bem como na resolução 1920x1080.

Parece que o principal culpado é o compilador gcc usado com os drivers Ubuntu vs. Nvidia era diferente, portanto os instaladores automáticos nunca funcionariam. Espero que isso ajude alguém a obter os drivers da Nvidia instalados no Ubuntu!

JohnP
fonte
Você já mudou seu compilador c padrão?
sziraqui 15/04
Agora eu entendi por que meus drivers quebram após uma atualização. Alterei o GCC padrão para gcc-5 por causa do projeto atual. Sempre que o dkms reconstrói o kernel, o módulo nvidia-drm falha na compilação porque requer o mesmo compilador usado para compilar o kernel do sistema operacional (gcc-7 para Ubuntu 18.04). Isso leva a uma instalação quebrada de drivers. Isso não é relatado como um erro pelo dkms nem pelo dpkg.
sziraqui 28/04
Voltar o gcc para gcc-7 não resolveu o meu problema.
sziraqui
Alguém conseguiu resolver esse problema. Eu tentei todos os tipos de correções para isso, mas sem sucesso. Eu realmente não quero usar o Windows nesta máquina. Se alguém tiver conseguido resolver o problema, ajude-me!
Sachin Borkar