Congelamento de nova compilação; Qual a probabilidade de uma inicialização dupla ser a causa?

0

Atualização 7 - 02/02/2018

Eu mudei a CPU. Foi estável por aproximadamente 6 horas e depois os sintomas usuais.

Nesta atualização, reiterarei as coisas que vale a pena lembrar e quais etapas foram concluídas para tentar resolver o problema.

Sintomas

A máquina trava e congela completamente, aparentemente aleatoriamente. Este não é apenas um problema do Windows 10, a menos que o Windows 10 tenha conseguido afetar o hardware de baixo nível. Isso se deve ao fato de eu ter inicializado com o Linux duas vezes e que nem um pendrive ao vivo com um sistema operacional funcionou. Todos congelaram.

O sistema fica mais estável depois de deixá-lo fora da noite para o dia. Vai durar aproximadamente 30m a 1h. Depois de experimentar o primeiro congelamento, isso pode acontecer a cada 20 minutos.

Ao executar o memtest86, o problema realmente fazia com que esse utilitário congelasse sempre a marca de 19 a 20 minutos. Isso foi por volta do Teste 10: Adormecido. Pouco antes do teste do martelo.

Comprei outro cartão de memória RAM e executei o memtest86. Ficou mais longe. Mas o segundo passe, congelou novamente. Nenhum erro foi detectado com qualquer stick de RAM.

Suspeitas e Causa Raiz Potencial

Toda vez que meu computador congelava, eu notava que minhas configurações de BIOS eram alteradas. Somente os perfis de memória. O overclock seria ativado e qualquer coisa relacionada às tensões mudaria para 1,2V.

Não importa quantas vezes eu os salvasse, eles pareceriam corrompidos ou reverteriam.

Eu tentei P3.00, P3.30 e P4.50. Todas as versões fizeram a mesma coisa.

Quando eu carregava o Windows o tempo suficiente para visualizar o utilitário A-Tuning (a propósito, não uso overclock, usei-o para fins de diagnóstico), observaria que a tensão DRAM não teria uma leitura. O valor não foi definido.

Portanto, suspeito que o problema esteja relacionado ao gerenciamento de memória e aos perfis de memória no nível mais baixo. Estou certo de que há problemas com os sistemas operacionais e esta placa / CPU, mas isso claramente não é um deles, a menos que, de alguma forma, o Windows esteja sempre executando alguns processos muito cedo ... de alguma forma.

Minha diretoria deve ser enviada para a Holanda e depois para Taiwan. Não suspeito que isso seja corrigido em breve. No entanto, estou pronto para receber minha terceira placa em duas semanas, e este será meu segundo CPU e segundo stick de RAM.

Vale ressaltar que removi todos os outros componentes e periféricos para diagnosticar isso. Somente o essencial foi usado. Especialmente no caso de falhas de USB ao vivo, eu não tinha nenhum SSD ou HDD conectado. Carregaria e congelaria após algum uso.

Finalmente, é importante observar que eu limpei o CMOS regularmente entre os flashes do BIOS para determinar definitivamente a corrupção dos dados do BIOS após o congelamento.

Atualização 6

O novo conselho fez pouca diferença. Eu suspeito que a CPU deve ser alterada.

Atualização 5 - 26/01/2018, 15:42

Durante o fim de semana, eu parei a máquina de dormir, para poder usar a área de trabalho remota nela.

Isso funcionou bem até às 00:22, de acordo com seu status online. Não consigo mais me conectar à máquina e não tenho certeza do motivo específico até voltar para casa. Preocupa-me que esse defeito esteja causando o aquecimento excessivo da máquina e, quando eu voltar, estará superaquecendo.

Pode ser um caso de atualizações do Windows, mas geralmente a máquina é reiniciada e reconectada à rede.

Atualização 4

Substituí a placa e, até agora, não há problemas. Notei nas configurações de economia de energia do Windows 10 que agora tenho uma opção que diz 'AMD Ryzen Balanced '. Estou muito certo de que isso não estava lá antes.

Não alterei o BIOS da versão fornecida e da versão P3.0. Embora, eu possa tentar isso no futuro.

Fiz um teste de estresse da GPU com o OCCT e ele chegou a 40 minutos sem problemas. Anteriormente, congelava às 08:29. Isso não indica que foi a causa, mas carregar jogos também o congelaria com mais frequência, apesar de puxar a GPU e inseri-la novamente no slot.

Novamente, isso ainda não pode ser resolvido, pois os problemas anteriormente não se manifestavam até cerca de três dias após o uso.

Atualização 3 - 12:27, 23/01/2018

Percebi que, quando carrego um jogo, ele tende a travar / congelar mais. Isso não significa que é a causa, mas pode indicar algo .

Decidi rodar um software de mineração para tentar estressar um pouco mais a GPU, vendo como a OCCT congelou por volta das 08:29 minutos em um teste.

Percebo que, quando encerro o software de mineração, por algum motivo, o sistema trava completamente. Vale a pena explorar ainda mais.

Atualização 2 - 23:57, 22/01/2018

As etapas de atualização anteriores não funcionaram. Eu também estava usando o OCCT e parece ter congelado 08:29 em um teste de GPU de 1 hora.

Atualização 1 - 19:10, 22/01/2018

O sistema é estável desde que foi ligado, depois de desligado o dia todo. Eu não sei porque. Instalei as atualizações do Windows 10 via USB e atualmente estou baixando um pouco mais através do método usual do Windows 10.

  • Vou continuar o download das atualizações do driver do chipset AMD.
  • Surpreendeu a instalação do Windows 10 não congelar, como aconteceu na noite passada. Eu li anteriormente que isso pode consertar as coisas.
  • Apesar dessas tentativas acima, solicitei a devolução do conselho. Não tenho certeza do que fazer se isso permanecer estável. Para retornar a placa atual, ou não. Ainda não tentei nenhum dos outros métodos sugeridos.

Ativado para baixar e instalar ...

Componentes

Placa-mãe: ASRock 350m Pro4

Processador: Amd Ryzen 5 1600 com refrigeração padrão (sem overclock)

Memória RAM: Vengeance LPX DDR4 2400Mhz 8GB

SSD: Crucial MX300 275GB

Placa de rede: Gigabyte GC-WB867D-I

Fonte de alimentação: Corsair TXM550M 550W

GPU: EVGA Nvidia 1060 GTX 3GB S Gaming

Descreva seu problema. Liste quaisquer mensagens de erro e sintomas. Seja descritivo.

O problema em si é o travamento / congelamento do PC, mas com a energia restante ligada. Às vezes, as telas desligam. Às vezes eles não. O mouse e o teclado não respondem mais nesse estado. Eu construí esta máquina há cinco dias, sem problemas até 2 dias atrás. Durante 3 dias, não houve problemas.

Não há um tempo definido para isso; isso acontecerá se estiver ocioso ou executando uma tarefa. Isso aconteceu ao tentar carregar um stick USB ativo com um sistema operacional ou quando o sistema operacional está carregado. Mas eu não experimentei isso quando estava no BIOS, antes de tentar carregar um sistema operacional. Isso ocorre no Windows 10 e no Linux Mint em uma inicialização dupla usando o software de seleção de inicialização GNU Grub.

Quando isso acontece, devo reiniciar a máquina com força.

Liste tudo o que você fez na tentativa de diagnosticar ou corrigir o problema.

  • No começo eu pensei que era conflito de software ou driver. Desinstalei os drivers e ele ainda permaneceu.

  • Tentei garantir que todos os cabos da minha fonte de alimentação estejam corretamente e sem assentamentos soltos dos componentes.

  • Atualizei o firmware do BIOS de P3.00 -> P3.40 -> P4.50.

  • Tentei executar o memtest86 e, por 3 passagens, funcionou. Reiniciei a máquina e executei o teste durante a noite, apenas para congelar na 8ª passagem sem erros detectados.

  • Executei o Windows memtesk e chkdsk sem erros.

  • Tentativa de executar o Linux Mint Live USB, mas isso não carrega mais, apesar de carregar alguns dias atrás .

Os planos futuros incluem a conexão de um disco rígido antigo e a instalação de um sistema operacional, enquanto o SSD está desconectado. Se isso funcionar, isso indicaria que há um problema com o SSD ou a maneira como a inicialização dupla está configurada para Windows e Linux.

Forneça os detalhes adicionais que você deseja abaixo.

Imagem de bloqueio do Memtest - sem erros

mpw
fonte
1
Certamente é possível. De volta a um antigo laptop Vista, anos atrás, tive problemas com a inicialização dupla; O Windows trava na animação da barra de progresso "Iniciando o Windows", que, se bem me lembro, tinha algo a ver com o driver sem fio.
MoonRunestar 22/01
@ Sonickyle27, curiosamente, não foi um problema, ou não, que eu notei. Não tenho certeza se o Windows e o Linux estão lutando contra o espaço e de alguma forma congelando.
MPW
O plano balanceado da AMD Ryzen é um plano de energia otimizado para as CPUs Ryzen que vem com os drivers de chipset mais recentes. Não depende do conselho, depende do sistema operacional. O Windows 10 deve ter baixado uma atualização que incluía drivers de chipset mais recentes. Como alternativa, você pode baixá-los da página da AMD.
miravalls
Está correto @miravalls. Eu os baixei, mas anteriormente eles não eram visíveis. Não até a nova diretoria. Talvez tenha havido uma atualização do Windows.
MPW

Respostas:

0

O congelamento do Memtest pode indicar erro em: placa mãe, CPU ou RAM. Observe que o memtest precisa armazenar um pouco de dados na memória para executar, portanto qualquer um desses componentes pode ser o culpado. Observe também que alguns problemas de HW surgem apenas sob carga ou uso prolongado (devido ao calor e ou não tendo tensão suficiente).

Minha primeira abordagem seria testar com memtest cada cartão de memória RAM individualmente.

Você já pensou que está sofrendo com o Ryzen Bug ?

Os primeiros lotes de CPUs Ryzen tinham um bug de HW que era facilmente acionado sob cargas pesadas (como no uso de 100% em todos / quase todos os núcleos), mas isso acontecia aleatoriamente, dependendo da carga de trabalho e dos programas. Eu mesmo experimentei isso na minha configuração, que é muito semelhante à sua. Eu experimentei falhas aleatórias, tanto no Windows 10 (enquanto jogava) quanto no Ubuntu (enquanto trabalhava), e o memtest nunca detectou erros. Depois que descobri o bug, fiz RMA na placa-mãe e na CPU (o fornecedor sugeriu, eu só iria fazer a RMA na CPU).

As substituições funcionam muito bem e não tive problemas desde então.

Você já tentou executar o kill-ryzen no github ? Se este script falhar ou gerar "falha na compilação", você certamente terá uma CPU ruim.

miravalls
fonte
Olá, obrigado pela sua resposta. Na verdade, só tenho o stick de 8GB DDR4. Não tenho certeza se posso descartar isso agora. 7 passes parecem suficientes. 10 no total. Vou tentar executar o script kill-ryzen, mas como o congelamento é muito inconsistente, não sei se vou conseguir. Se eu detectar um erro e não soubermos o que é, você acredita que a RMA é a melhor placa e CPU? Obrigado
mpw
@mpw Eu nunca passei mais do que 3-4 passes no memtest, encontrando um erro depois disso é um AFAIK muito estranho. No entanto, uma falha no teste de memtest não significa que a memória está ruim, ainda pode ser o Ryzen Bug. A RMA dependerá do seu fornecedor, eu entraria em contato com ele, explicaria as falhas aleatórias e veria o que elas sugerem. Talvez eles prefiram enviar o PC aos seus técnicos para um relatório oficial primeiro.
miravalls
@mirvavalls - ok, obrigado. Eu construo esta máquina a partir de peças individuais, por isso não tenho certeza de quem seria o precedente ou me responsabilizo por testá-la. As peças vieram de várias fontes.
MPW
@mpw e tente executar o script. Se falhar, tente fazer o RMA da CPU e talvez da placa-mãe, não sei dizer se há algum erro também. Os erros de HW são muito difíceis de depurar se você não tiver peças de reposição para trocar e restringir o único culpado. Boa sorte!
miravalls
Estive em contato com a ASRock. Eles afirmam que o problema está relacionado aos processadores Ryzen. O script kill não parecia funcionar corretamente. Ele ficou preso no loop 11, mas até indica qualquer mensagem de erro. A ASRock está ciente do problema e está tentando replicá-lo. Eu potencialmente o consertei com uma nova placa, mas como você pode ver na atualização, estou ausente por enquanto e ela potencialmente congelou. No entanto, posso executar o ping na máquina, mas não apenas a área de trabalho remota.
MPW
0

Eu tenho a mesma placa-mãe e tive problemas estranhos com o congelamento. Eu pensei que meus problemas eram diferentes porque eu poderia fazê-los parar, mas agora estou pensando que realmente encontrei a solução (pelo menos no Linux). Se você ainda possui esta placa-mãe, tente adicionar iommu = off nos parâmetros do kernel na inicialização e volte a ligar comigo se o congelamento parar. Eu uso meu sistema para passagem de gpu, portanto, preciso explicitamente do IOMMU para o que faço. Então, me deparei com essa solução apenas afetando meu fluxo de trabalho. Claro que, se eu estiver certo, isso é apenas uma solução alternativa, pois isso indicaria um defeito.

Urmamasllama
fonte
Eu costumava experimentar problemas de PCI-E no log do Linux quando tive o problema. Troquei a placa-mãe 4 vezes e agora funciona. Finalmente.
mpw 18/05/19