Como diagnosticar travamentos e congelamentos do computador?

29

Eu construí um computador desktop há alguns anos com as seguintes especificações:

  • CPU: Intel Core 2 Quad Q9300 Yorkfield 2.5GHz 6 MB L2 Cache LGA 775 Processador de núcleo quádruplo de 95W BX80580Q9300
  • Placa-mãe: Placa-mãe EVGA 122-CK-NF68-T1 LGA 775 NVIDIA nForce 680i SLI ATX Intel
  • Placa de vídeo: Duas EVGA 256-P2-N758-TR GeForce 8600GT SCC 256 MB GDDR3 de 128 bits GDDR3 PCI Express x16 SLI Placa de vídeo suportada
  • PSU: SeaSonic S12 Energy Plus SS-550HT 550W ATX12V V2.3 / EPS12V V2.91 Fonte de alimentação PFC ativa certificada SLI CrossFire Ready 80 PLUS
  • Memória: Dois G.SKILL 4 GB (2 x 2 GB) SDRAM DDR2 de 240 pinos DDR2 800 (PC2 6400) Kit de canal duplo Kit de memória de mesa Modelo F2-6400CL5D-4GBPQ

Desde o seu início, a máquina trava periodicamente, com a regularidade variando ao longo dos anos de uma vez por dia a uma vez por mês. Normalmente, os bloqueios ocorrem uma vez a cada poucos dias.

Por "bloqueio", quero dizer que meu computador congela. A tela trava, não consigo mover o mouse. Pressionar as teclas do meu teclado que normalmente ativam ou desativam os LEDs no teclado (como Caps Lock) não liga mais os LEDs. Se havia música tocando no momento do bloqueio, o ruído continua saindo dos alto-falantes, mas é apenas a frequência / nota atual que é reproduzida indefinidamente. Não há BSOD.

Quando esse bloqueio ocorre, eu tenho que fazer uma reinicialização completa desligando o computador ou pressionando o botão de reinicialização.

Eu tenho a versão mais recente dos drivers de hardware da NVIDIA e os atualizo semi-regularmente, mas isso não pareceu ajudar. Atualmente, estou usando o Windows 7 x64, mas anteriormente estava usando o Windows Server 2003 x64 e tendo os mesmos problemas de bloqueio.

Meu palpite é que, de alguma forma, está relacionado ao driver de vídeo ou à placa-mãe, mas não sei como diagnosticar esse problema para diminuir qual dos dois é o culpado.


Informações adicionais sobre: ​​resfriamento Em relação ao resfriamento ... Eu não instalei nenhum sistema de resfriamento pós-venda além de dois ventiladores comuns que peguei em um computador antigo. O ventilador no topo da CPU é o que acompanha o produto. Um dos dois ventiladores eliminados que eu adicionei, localizado na torre inferior do canto, na tentativa de criar um fluxo de ar da frente para trás. O segundo ventilador é apontado diretamente para as duas placas de vídeo.


Instalação e leituras do SpeedFan Por sugestão do studiohack, instalei o SpeedFan , que fornecia as seguintes leituras de temperatura:

  • GPU: 63C
  • GPU: 65C
  • Sistema: 76C
  • CPU: 64C
  • AUX: 36C
  • Core 0: 78C
  • Núcleo 1: 76C
  • Núcleo 2: 79C
  • Núcleo 3: 79C

Atualização # 3: Outro bloqueio :-( Bem, eu tive outro bloqueio ontem à noite. :-( O SpeedFan relatou a temperatura da CPU a 38 ° C quando isso aconteceu, e não houve aumento na temperatura que antecedeu o congelamento.

Uma coisa que noto é que o congelamento parece mais provável se eu estiver assistindo a um vídeo. De fato, dos últimos 5 congelamentos no mês passado, 4 deles ocorreram enquanto assistia a um vídeo no Flickr. Não necessariamente o mesmo vídeo, mas um vídeo mesmo assim. Não sei se isso é apenas coincidência ou se isso significa alguma coisa. (Além disso, todas as noites antes de dormir, minha filha de 2 anos se senta no meu colo e assiste a alguns vídeos caseiros no Flickr e, no último mês, aprendeu a frase "Uh, o computador quebrou".)


Atualização # 4: Resultados dos testes MemTest86 e 3DMark06 :

Por sugestões nos comentários, executei o MemTest86 durante a noite e ele percorreu os 8 GB de memória 5 vezes sem erros. Também realizei o teste 3DMark06 sem problemas (veja minhas pontuações em http://3dmark.com/3dm06/15163549 ).

E agora? :-)

Alguma sugestão adicional sobre o que verificar? Existe alguma maneira de obter um rastreamento de pilha ou algo assim quando o computador é bloqueado dessa maneira?

Resolução

Eu nunca descobri os problemas específicos, mas com base nas sugestões aqui e em outros lugares, presumo que seja um problema na placa-mãe. De qualquer forma, atualizei recentemente meu sistema, comprando uma nova placa mãe, PSU, CPU e RAM, e esse novo equipamento vem trabalhando esplendidamente nas últimas semanas. Estou usando as mesmas placas gráficas da configuração antiga, então acho que é seguro argumentar que elas não foram a causa do problema.

Scott Mitchell
fonte
A primeira palavra que vem à mente é calor ... como você está mantendo o sistema frio?
James Mertz
@ KronoS: editei minha pergunta para incluir a situação de resfriamento. Observe que não estou usando nenhum software de monitoramento de temperatura da CPU.
Scott Mitchell
2
Você deve instalar o SpeedFan e deixe-nos saber os temps ...
studiohack
@studiohack: Obrigado pela sugestão - baixei e instalei o SpeedFan e editei minha pergunta para incluir essas novas leituras. Essas leituras de temperatura são normais?
Scott Mitchell
2
@ Scott Faça o download do 3dMark '06 e do FurMark deixe-o funcionar por algumas horas. Relatar qualquer falha. Se falhar, use apenas 1 placa de vídeo por vez
Sathyajith Bhat

Respostas:

11

A julgar pelo que você publicou em temperatura e resfriamento, seu computador está superaquecendo e essa é a primeira coisa a corrigir. 64 C em uma carga inativa não é aceitável e não é realmente preferido com uma carga total. Sou um pouco paranóico e surto sempre que minha CPU ultrapassa os 35 anos, mas realmente 50 deve ser o seu máximo em uma carga.

Invista em uma boa solução de refrigeração para o seu sistema. Um sistema bastante decente custará apenas entre 20 e 30 dólares. Se você está procurando alguma ajuda sobre o que procurar, dê uma olhada nesta revisão de Tom's Hardware de soluções de refrigeração abaixo de US $ 40.

Além disso, convém ativar sua tela azul da morte (por mais terrível que pareça) para poder depurar os bloqueios problemáticos. Isso é feito por:

-> clicando com o botão direito do mouse em "Computador" no menu Iniciar

-> Selecione "Propriedades"

-> Selecione "Configurações avançadas do sistema"

-> Selecione a guia "Avançado"

-> Selecione a opção "Inicialização e recuperação"

-> Verifique se "Gravar um evento no log do sistema" está ativado.

Às vezes, existem limpadores que impedem automaticamente a gravação de BSODs ( Advanced System Care ) e você pode querer evitar isso. Depois de verificar esse problema, sugiro usar o BlueScreenView do NirSoft para visualizar os detalhes relacionados à falha / depuração.

Finalmente, eu verificaria e verificaria novamente o seu PC e TODAS as suas conexões. Na verdade, tive uma situação semelhante e descobri que um dos cabos USB da placa-mãe interna estava conectado incorretamente, causando problemas.

Atualizar

Fiz algumas perguntas para solucionar problemas gerais e diagnosticar falhas ou congelamentos. Consulte-os também, pois eles também podem ajudá-lo na sua busca pelo problema.

James Mertz
fonte
@KronoS: Você tem algum sistema de refrigeração recomendado que gostaria de compartilhar?
Scott Mitchell
@ScottMitchell ... resposta atualizada. Eu recomendo que você faça sua pesquisa, já que a situação de cada superusuário é diferente.
James Mertz
3
@ScottMitchell Eu recomendo que você altere o material da interface térmica (TIM, também conhecido como pasta térmica) antes de adicionar qualquer resfriamento externo. Além disso, verifique se há poeira nos ventiladores / churrasqueiras / respiradouros e limpe-os com uma explosão de lata de ar comprimido.
Sathyajith Bhat
@Sathya: Obrigado pela sugestão. Eu quebrei o caso na semana passada e o computador funcionou por um dia com um gabinete aberto e as temperaturas caíram para os 40 anos. Hoje de manhã, inspecionei o sistema de refrigeração existente da CPU e notei muita poeira cobrindo as grades embaixo do ventilador, então limpei-as. Volto a colocar o gabinete e veremos se as temperaturas ficam baixas e se isso ajuda a evitar futuros congelamentos. (Em caso afirmativo, vou marcar isso como a resposta ...) #
535 Scott Mitchell
@ Scott Estou feliz em ouvir, mantenha-nos atualizados.
Sathyajith Bhat
5

Os congelamentos do sistema (onde você não pode usar teclas de atalho como CTRL + ALT + DEL) são causados ​​por drivers travados,
portanto , você precisará substituir o dispositivo ou atualizar o driver. A solução de problemas pode ser feita:

  1. Baixe a instalação do Windows Performance Analysis Tools para sua versão do Windows.
  2. Instale o software no seu sistema.
  3. Abra um prompt de comando como administrador e copie e cole o próximo comando:

    xperf -start perf!GeneralProfiles.InBuffer && timeout -1 && xperf -stop perf!GeneralProfiles.InBuffer myTrace.etl
    
  4. Pressione ENTER uma vez para iniciar o comando, agora você terá que esperar até o sistema travar.
    Você pode fazer o que quiser. Por favor, nenhuma atividade pesada, como jogos ou coisas particulares ...

  5. Logo após o sistema parar, você vai ao console e pressiona ENTER.
  6. Depois de esperar algum tempo, um arquivo de log myTrace.etl será produzido, compactá-lo em um arquivo zip.
  7. Coloque esta versão compactada do arquivo em algum lugar online (talvez 2shared).
  8. Compartilhe o link aqui, tentarei encontrar e mostrar a causa do seu problema.
Tamara Wijsman
fonte
11
Pergunta re: etapa 5 - o que faço se o sistema nunca parar de desligar até que eu reinicie a máquina?
Scott Mitchell
@ ScottMitchell: Tente criar um despejo de memória manual nesse caso.
Tamara Wijsman
4

Se já se passaram alguns anos desde que o computador foi construído, uma limpeza completa seria um bom curso de ação. Remova toda a poeira dos ventiladores, dissipadores de calor, placas e cantos. As partes mais importantes são os dissipadores de calor e os ventiladores da CPU. O ar comprimido é bom para esse fim, mas um aspirador de pó pode ser mais saudável a longo prazo. Fazer isso minuciosamente reduzirá bastante a ventilação e o calor.

O calor não deve ter sido um problema com um computador novo, a menos que seja mantido em uma sala (ou gabinete) muito quente e com pouca ventilação. Os fabricantes de CPU antecipam que seus produtos sejam usados ​​em condições variadas e até o dissipador de calor e o ventilador são feitos para permitir que o produto funcione na maioria das circunstâncias.

Desde que você teve os problemas desde que o construiu, tendem a inclinar-se para uma falha em um dos componentes. Com base nos problemas descritos, estou inclinado a encontrar uma placa-mãe com defeito, apenas com base na minha própria experiência.

Xantec
fonte
1
Como observei na minha pergunta, esse problema de congelamento vem ocorrendo com certa regularidade desde que construí o computador. Infelizmente, não é uma ocorrência recente.
Scott Mitchell
corrigir. é por isso que eu me inclino para um equipamento defeituoso em vez de aquecer, pois o calor não deveria ter sido um problema quando você o construiu (a menos que o local onde você mantém o computador esteja muito quente)
Xantec
O calor poderia ter sido um problema quando o sistema foi construído. Certa vez, recebemos uma estação de trabalho com processador duplo de um grande fabricante, com os ventiladores do processador conectados aos pinos dos ventiladores da placa mãe do outro processador. ... Mas não é provável que o problema neste caso.
Mike Chess
1

Eu passei por esse processo no ano passado.

A primeira coisa é determinar se é hardware ou software. Isso significa executar dois sistemas operacionais diferentes. No meu caso, minha instalação principal era linux e estava congelando aleatoriamente - semelhante ao que você descreve. Às vezes a cada 5 minutos, outras vezes, durava vários dias.

Acabei instalando o Windows nele, que apresentava os mesmos problemas. Quando reiniciei, e ele parou durante a postagem, retornei o MB e não tive problemas desde então.

Como parte do processo de depuração, tentei também diferentes drivers de vídeo - os drivers genéricos e não acelerados não congelavam com tanta frequência. Eu também instalei o temp. utilitários de monitoramento e revisou os logs para verificar se havia algo comum acontecendo antes do congelamento. Como era hardware e aparentemente aleatório, nunca encontrei nenhuma maneira de causar o problema com segurança, mas esse deveria ser seu objetivo.

chris
fonte
Não sei exatamente o que você está sugerindo aqui?
James Mertz
Se houver um problema com o hardware, o problema estará presente independentemente do sistema operacional. Se ele aparecer apenas com um sistema operacional, e não com outro, provavelmente será um software.
chris
1
@chris: O problema existe desde que eu construí o computador. Inicialmente, eu estava usando o Windows Server 2003, depois atualizei para o Windows 7. Nos dois sistemas operacionais, experimentei esses congelamentos / travamentos.
Scott Mitchell
@ Scott - Você também está monitorando o tempo da GPU? Se vários sistemas operacionais enfrentam o mesmo problema, eu preferiria o hardware, embora eu ache que os dois estejam usando o mesmo driver de vídeo. Você já tentou remover uma das placas de vídeo e ver se consegue reduzi-la a uma placa específica?
Chris12 /
1
Bem, se você assumir que não são as placas de vídeo, resta memória, placa-mãe ou software. Se você descartar o software devido a problemas no Win7 e Win2003 (o que eu não faria), isso deixa memória ou MB. Você pode trocar a RAM?
Chris14 /
1

Eu suspeitaria da fonte de alimentação primeiro. Tente substituí-lo por uma unidade de energia mais alta e veja se as coisas se tornam mais estáveis. Pode ser que os trilhos de tensão estejam caindo um pouco sob carga, o que explica por que ele aparece com mais frequência na reprodução de vídeo.

Para testar essa teoria, você precisará de um voltímetro preciso e de algumas habilidades elétricas básicas, mas, dada a utilidade de uma fonte de alimentação sobressalente, ficaria tentado a trocá-la e ver.

Cínico ideal
fonte
1

Com base na atualização nº 3 e em um bloqueio a 38 ° C, o mobo / cpu heat não é a causa raiz. Supondo que você tenha apenas as placas de vídeo adicionadas e nenhuma outra placa adicional (eu já fiz isso muito bem!), Faço essas recomendações na ordem em que acredito ser a causa mais provável:

  • Substitua as placas de vídeo por uma placa válida conhecida diferente para solucionar problemas. Compre um, peça emprestado um - qualquer que seja. Se isso não resolver, passe para o próximo marcador.

  • Você mencionou a atualização do driver da placa de vídeo, mas mais nada. Verifique se todos os drivers possíveis estão realmente atualizados. Eu tinha um cartão de memória para fazer isso uma vez e tudo o que precisava fazer foi corrigir o driver.

  • Se você realmente não tiver outros cartões adicionais (se houver, remova-os agora), desative todos os equipamentos opcionais na bios. Por isso, quero dizer o seu som a bordo, lan e retire todos os itens USB. Então, veja se desaparece.

Vou sair do ramo e dizer que tenho 90% de certeza de que isso será corrigido com o item 1.

Flotsam N. Jetsam
fonte
0

Parece que o hardware ou os drivers são o problema aqui. Embora eu esteja inclinado para o hardware, já que você tem dois sistemas operacionais diferentes no computador.

Trabalhando nessa suposição, comece com as coisas mais fáceis. Vi que você executou o Memtest e, embora seja ótimo, não exclui necessariamente a memória como suspeita. Portanto, tente o seguinte: retire tudo, exceto um cartão de memória e veja se você recebe um bloqueio. Se funcionar bem por um tempo, coloque mais um e assim por diante até que você tenha o problema novamente. Se ele ainda travar, tente um stick diferente em um slot diferente. Se ainda estiver travando, mude para outros componentes de hardware.

Algumas pessoas mencionaram a tentativa de trocar sua placa de vídeo e eu concordo. Compre um barato ou peça emprestado a um amigo e tente isso. Faça o mesmo com uma fonte de alimentação. Seu PSU parece decente, mas eles não funcionam e vale a pena trocar e ver se isso resolve o seu problema.

Se tudo isso falhar, diria substituir a placa-mãe. Especialmente desde que você disse que teve o problema desde que adquiriu o computador.

Uma última coisa a verificar apenas para estar do lado seguro. Faça um teste chkdsk / SMART nos discos rígidos. Eles provavelmente estão bem, mas vale a pena conferir de qualquer maneira.

Nori
fonte
0

Pela sua descrição, parece que o problema está na placa-mãe. Pode ser que o seu northbridge tenha um problema ( diagrama da placa-mãe ). O que eu verificaria também é a configuração do BIOS para o gerador de clock e a velocidade da CPU. (Não conheço sua placa-mãe, mas talvez ela tenha alguns recursos de overclock.) Talvez os problemas sempre aconteçam quando há uma carga alta e a CPU tenta rodar mais rapidamente.

Raffael
fonte
0

Estou indo para uma asa aqui e sugerindo que o culpado é um capacitor queimado que é incapaz de fornecer uma carga elétrica para suavizar os erros de flutuação de corrente. Suponho que uma flutuação significativa o suficiente fará com que o sistema congele, mas permaneça ligado.

Com base na experiência passada, atribuiria a culpa a um capacitor queimado em sua fonte de alimentação (PSU), mas sugeriria que verifique todos os capacitores do seu computador, dentro e ao redor da placa-mãe, principalmente ao redor da ponte norte. Se você estiver fazendo overclock, é provável que a placa-mãe esteja frita. Embora seja improvável que qualquer capacitor tenha soprado sob dissipadores de calor, isso também pode ser uma possibilidade.

Se você não encontrar nada na placa-mãe, eu garantiria o seu PSU, pois alguns têm uma garantia longa - minha de 7 anos -, portanto, não abra-o para inspecioná-lo, a menos que você saiba que está sem garantia. Uma fonte de alimentação decente pode ser corrigida com as ferramentas certas, se for apenas um capacitor.

Jonathan
fonte
-1

Eu lidei com muitas situações como essa, e o problema mais comum que encontrei com travamentos ou congelamento foi a pasta do dissipador de calor. Seu ventilador pode fazer o que quiser, mas se for permitido um espaço entre o dissipador de calor e a CPU, o dissipador de calor não esfriará o ar entre os dois. Se a pasta estiver muito seca ou em locais onde não deveria ser, ou insuficiente ou não permitir uma conexão de calor condutora entre o processador e a pia, ela será bloqueada porque está ativando um circuito de proteção do processador no próprio processador . Faça isso cinco ou seis vezes até que o problema desapareça. Eventualmente, ou jogaremos seu processador fora e enviaremos um novo para você sem nem mesmo informar. Não queremos substituir sua CPU. Fazemos isso 10 vezes antes de fazer isso.

Relevante, mas não posso lhe dizer
fonte
1
Posso acreditar que você pode saber do que está falando, mas não consigo entender o que está dizendo. Por favor, edite sua resposta para esclarecer: eu comecei. Por exemplo: “Faça cinco ou seis vezes…” –– faça o que? “Fazemos isso 10 vezes ...” –– fazemos o quê e quem somos “nós”? Além disso, esclareça o que você está dizendo que Sathya ♦ não disse em seu comentário em 10 de dezembro de 2010 às 21:36 .
Scott
-1

Pode ser um problema de driver - sempre que estiver prestes a manipular seu vídeo, ele provavelmente trava (também pode causar um ruído estranho) porque sua tela está congelando - a CPU ainda pode funcionar - na verdade tudo pode estar funcionando - você pode apenas não consiga ver os resultados das manipulações do mouse / teclado, porque uma vez que o driver trava, não há nada para lidar com as representações visuais das entradas.

Solução potencial: atualize o driver, se ele iniciou quando você atualizou um driver, volte para o driver anterior, se sua placa de vídeo for antiga - tente comprar uma nova - às vezes, quando placas antigas são corrigidas com novos drivers, podem estar com erros.

O superaquecimento é realmente um problema apenas quando o seu cartão que trabalha 110% de sua energia fabricada pode causar um acidente, mas novamente, se apenas você o aumentar muito.

Enariel
fonte
Isso é um palpite, embora decente. Mas também pode ser energia, um componente individual falhando, aquecimento em algum lugar além da CPU (GPU, disco rígido). Também pode ser apenas uma instalação ruim.
Austin T French
-2

Eu concordo com Nori sobre fazer um teste SMART. Use (a edição gratuita) HDTune para copiar nos atributos SMART. Faça também uma verificação de erro. Um único setor danificado pode causar os problemas que você está descrevendo. O superaquecimento geralmente causa BSOD e uma reinicialização ou desligamento forçado. Como está "congelando", parece-me mais um problema de disco rígido (mesmo que discos rígidos ruins possam causar BSODs também).

Verifique o status SMART e anote os dados "Contagem de horas de inicialização". Se a contagem não aumentar depois de algumas horas, os atributos SMART provavelmente serão congelados e fornecerão um status falso de "OK".

Verifique também se há erros nos logs de eventos do sistema e do Windows.

(painel de controle -> Ferramentas administrativas -> Gerenciamento do computador -> Visualizador de eventos)

Faça backup de todos os seus dados importantes.

James T
fonte
Os problemas de disco quase sempre pioram com o tempo, o que não acontece na descrição.
Flotsam N. Jetsam
@Flotsam Bom ponto. Um disco rígido escamoso provavelmente estaria morto depois de alguns anos. Talvez um controlador RAID esquisito então. Os logs de eventos ainda podem fornecer algumas boas dicas.
James T
Não é um péssimo conselho, mas não está no local para esta configuração e sintomas descritos.
Ярослав Рахматуллин