Rastreando BSOD aleatório no Windows 7

8

Eu recebi um computador com o Windows 7 entregue que aleatoriamente, várias vezes ao dia, com um PAGE_FAULT_IN_NONPAGED_AREA (50) ou WHEA_UNCORRECTABLE_ERROR (124). Falhas acontecem independentemente da carga. Estou ficando sem idéias de como rastrear isso.

  1. A análise dos minidumps mostra que a falha está no ntkrnlmp.exe / WMIADAP.exe
  2. O sistema possui muita energia (600w)
  3. Ram verifica bem usando memtest86 + em um fim de semana.
  4. O sistema está limpo por dentro. Não acumula poeira. As temperaturas permanecem baixas.
  5. Até onde eu sei (e o histórico de confiabilidade mostra), nenhum driver novo foi instalado por vários meses antes do início dos problemas. Todos os drivers estão atualizados.
  6. O sfc / scannow reporta o sistema como limpo.
  7. CHKDSK relata os discos como limpos
  8. A remoção do AV (Avast) não tem efeito.

Mais alguma coisa que deve ser tentada no Windows 7 antes de começar a substituir o hardware?

Edit: O sistema é construído sob encomenda, mas não com overclock. As partes principais são:

  • MB: Diamante MSI P6N
  • CPU: Core 2 Duo E6850
  • GPU: Raedon 5850
  • Fonte de alimentação: Corsair HX620
  • Memória: Corsair TWIN2X4096-6400C5
  • HD: Intel SSD X25-M G2

Edit: Crashes vem em grupos e parece ter se resolvido no page_fault agora. Aqui está o último grupo, incluindo o driver que os causou:

10-04-22 16:01  PAGE_FAULT_IN_NONPAGED_AREA ntoskrnl.exe    ntoskrnl.exe+70600
10-04-22 09:03  PAGE_FAULT_IN_NONPAGED_AREA ntoskrnl.exe    ntoskrnl.exe+70600
10-04-22 02:27  PAGE_FAULT_IN_NONPAGED_AREA fltmgr.sys  fltmgr.sys+16df
10-04-21 22:29  PAGE_FAULT_IN_NONPAGED_AREA Ntfs.sys    Ntfs.sys+b3293
10-04-21 17:32  PAGE_FAULT_IN_NONPAGED_AREA rdpbus.sys  rdpbus.sys+1f0a790
10-04-21 16:02  PAGE_FAULT_IN_NONPAGED_AREA serenum.sys serenum.sys+29fae00
10-04-21 15:00  PAGE_FAULT_IN_NONPAGED_AREA rdprefmp.sys    rdprefmp.sys+3ae8790
10-04-21 12:59  PAGE_FAULT_IN_NONPAGED_AREA cdrom.sys   cdrom.sys+2b12790
10-04-21 11:22  PAGE_FAULT_IN_NONPAGED_AREA rdpencdd.sys    rdpencdd.sys+289f70
10-04-21 10:43  PAGE_FAULT_IN_NONPAGED_AREA Msfs.SYS    Msfs.SYS+5b68760
10-04-21 10:34  PAGE_FAULT_IN_NONPAGED_AREA Msfs.SYS    Msfs.SYS+5aea720
10-04-21 10:18  PAGE_FAULT_IN_NONPAGED_AREA fltmgr.sys  fltmgr.sys+16df
10-04-21 04:19  PAGE_FAULT_IN_NONPAGED_AREA rassstp.sys rassstp.sys+1e72760
10-04-21 04:11  PAGE_FAULT_IN_NONPAGED_AREA Msfs.SYS    Msfs.SYS+4ce9330
10-04-21 03:16  PAGE_FAULT_IN_NONPAGED_AREA cdrom.sys   cdrom.sys+2a5ae00
10-04-21 03:03  PAGE_FAULT_IN_NONPAGED_AREA raspptp.sys raspptp.sys+2150420
10-04-21 02:12  PAGE_FAULT_IN_NONPAGED_AREA ntoskrnl.exe    ntoskrnl.exe+70600
10-04-21 02:03  PAGE_FAULT_IN_NONPAGED_AREA TDI.SYS TDI.SYS+163cb90
10-04-21 00:45  PAGE_FAULT_IN_NONPAGED_AREA ntoskrnl.exe    ntoskrnl.exe+70600
10-04-21 00:13  PAGE_FAULT_IN_NONPAGED_AREA VClone.sys  VClone.sys+2138330
10-04-20 23:20  PAGE_FAULT_IN_NONPAGED_AREA fltmgr.sys  fltmgr.sys+6033
10-04-20 21:01  PAGE_FAULT_IN_NONPAGED_AREA raspppoe.sys    raspppoe.sys+399d250
10-04-20 20:47  PAGE_FAULT_IN_NONPAGED_AREA umbus.sys   umbus.sys+2921760
10-04-20 15:09  PAGE_FAULT_IN_NONPAGED_AREA cdrom.sys   cdrom.sys+6c97760
10-04-20 15:03  PAGE_FAULT_IN_NONPAGED_AREA cdrom.sys   cdrom.sys+4245760
10-04-20 14:57  PAGE_FAULT_IN_NONPAGED_AREA cdrom.sys   cdrom.sys+16a2f70
10-04-20 13:10  PAGE_FAULT_IN_NONPAGED_AREA rasl2tp.sys rasl2tp.sys+ff46f180
10-04-20 11:47  PAGE_FAULT_IN_NONPAGED_AREA raspppoe.sys    raspppoe.sys+21ff790
10-04-20 10:26  PAGE_FAULT_IN_NONPAGED_AREA ntoskrnl.exe    ntoskrnl.exe+70600
10-04-20 09:57  PAGE_FAULT_IN_NONPAGED_AREA fltmgr.sys  fltmgr.sys+16df
10-04-20 09:27  PAGE_FAULT_IN_NONPAGED_AREA raspptp.sys raspptp.sys+1fae790
10-04-20 05:21  PAGE_FAULT_IN_NONPAGED_AREA hal.dll hal.dll+101bc
10-04-20 03:23  PAGE_FAULT_IN_NONPAGED_AREA ks.sys  ks.sys+27d2760
10-04-20 03:17  PAGE_FAULT_IN_NONPAGED_AREA ntoskrnl.exe    ntoskrnl.exe+70600
10-04-20 03:04  PAGE_FAULT_IN_NONPAGED_AREA csc.sys csc.sys+390f480
10-04-20 01:12  PAGE_FAULT_IN_NONPAGED_AREA peauth.sys  peauth.sys+91d760
10-04-20 01:04  PAGE_FAULT_IN_NONPAGED_AREA NDProxy.SYS NDProxy.SYS+28a7760
10-04-20 00:57  PAGE_FAULT_IN_NONPAGED_AREA USBD.SYS    USBD.SYS+240c7c0
10-04-20 00:51  PAGE_FAULT_IN_NONPAGED_AREA ntoskrnl.exe    ntoskrnl.exe+70600
10-04-20 00:44  PAGE_FAULT_IN_NONPAGED_AREA rassstp.sys rassstp.sys+1567790
10-04-20 00:38  PAGE_FAULT_IN_NONPAGED_AREA usbohci.sys usbohci.sys+1e20760
10-04-20 00:32  PAGE_FAULT_IN_NONPAGED_AREA wfplwf.sys  wfplwf.sys+3cb8760
10-04-20 00:26  PAGE_FAULT_IN_NONPAGED_AREA cdrom.sys   cdrom.sys+21e0570
10-04-20 00:10  PAGE_FAULT_IN_NONPAGED_AREA cdrom.sys   cdrom.sys+2ef0a10
10-04-20 00:07  PAGE_FAULT_IN_NONPAGED_AREA HIDPARSE.SYS    HIDPARSE.SYS+2600760
10-04-20 00:01  PAGE_FAULT_IN_NONPAGED_AREA ntoskrnl.exe    ntoskrnl.exe+70600
10-04-19 22:47  PAGE_FAULT_IN_NONPAGED_AREA kbdclass.sys    kbdclass.sys+2aba760
10-04-19 22:41  PAGE_FAULT_IN_NONPAGED_AREA cdrom.sys   cdrom.sys+baf4010
10-04-19 20:37  PAGE_FAULT_IN_NONPAGED_AREA Ntfs.sys    Ntfs.sys+bb16c
10-04-19 20:21  PAGE_FAULT_IN_NONPAGED_AREA cdrom.sys   cdrom.sys+b12da0

Algumas estatísticas rápidas sobre qual driver causa as falhas não me deixam mais certo. Claro, o kernel e o cdrom aparecem no topo, mas o resto parece ser mais ou menos tudo no sistema operacional:

cdrom.sys     9
ntoskrnl.exe  8
fltmgr.sys    4
raspptp.sys   4
Msfs.SYS      3
Ntfs.sys      2
raspppoe.sys  2
csc.sys       1
hal.dll       1
HIDPARSE.SYS  1
kbdclass.sys  1
ks.sys        1
NDProxy.SYS   1
peauth.sys    1
rasl2tp.sys   1
rdpbus.sys    1
rdpencdd.sys  1
rdprefmp.sys  1
serenum.sys   1
TDI.SYS       1
umbus.sys     1
USBD.SYS      1
usbohci.sys   1
VClone.sys    1
wfplwf.sys    1
pehrs
fonte
Você sabe se o computador que você obteve foi uma máquina personalizada ou de uma empresa bigbox como a hp ou a dell? Normalmente, os BSODs com falha de página estão relacionados a erros na memória e os BSODs WHEA normalmente apontam para a CPU. Você sabe se o computador estava com overclock?
Ryanyama
É uma construção personalizada, mas um hardware bastante padrão. O relógio é padrão.
pehrs
5
Enquanto googling para uma resposta, eu LOLed neste img361.imageshack.us/img361/9923/hidden0rp.jpg
Hugh Allen

Respostas:

6

Embora um driver possa estar atualizado, o hardware que ele gerencia pode ter se tornado esquisito e causar a interrupção.

Você pode tentar o BlueScreenView para analisar os despejos:

O BlueScreenView verifica todos os seus arquivos de minidump criados durante falhas na 'tela azul da morte' e exibe as informações sobre todas as falhas em uma tabela. Para cada falha, o BlueScreenView exibe o nome do arquivo minidump, a data / hora da falha, as informações básicas da falha exibidas na tela azul (código de verificação de bug e 4 parâmetros) e os detalhes do driver ou módulo que possivelmente causou a falha ( nome do arquivo, nome do produto, descrição do arquivo e versão do arquivo).
Para cada falha exibida no painel superior, você pode exibir os detalhes dos drivers de dispositivo carregados durante a falha no painel inferior .O BlueScreenView também marca os drivers que seus endereços encontraram na pilha de falhas, para que você possa localizar facilmente os drivers suspeitos que possivelmente causaram a falha .

harrymc
fonte
Não sabia sobre essa ferramenta. Obrigado! Parece muito útil. Criei um resumo do último monte de falhas e o adicionei à pergunta. Eu não tenho certeza se ele vai trazer mais clearity à questão, como as falhas são bem se espalhar ...
pehrs
@ pehrs: eu começaria a retirar os dispositivos que você não precisa, para ver se o problema desaparece. Eu começaria, é claro, pela unidade de CD, que também é provavelmente a mais fácil de substituir.
harrymc
Puxei o plugue da unidade de DVD e até agora está estável. Vou aguardar mais alguns dias antes de encerrar esta pergunta. Não me lembro de ter ouvido falar de uma unidade de DVD causando BSOD antes, mas acho que tudo tem uma primeira vez.
pehrs
@pehrs sim, qualquer coisa conectada ao seu computador pode causar isso. A unidade de DVD provavelmente está consumindo muita energia ou está ruim e está enviando dados malformados para o controlador IDE / SATA, causando o bloqueio do computador.
Earlz
3

Meu teste completamente não científico sugere que o primeiro componente a tentar substituir é a placa de vídeo. (de preferência com uma marca diferente)

Meu "teste" consiste em pesquisar no Google <component>e <component> BSODdividir o número de hits do segundo pelo primeiro para chegar a uma porcentagem:

  • E6850 1,7%
  • MSI P6N Diamond 2,3%
  • Radeon 5850 9,2%
  • Eu não acho que é a RAM devido a memtest86
  • PSU e SSD também parecem improváveis

Aliás, quando eu estava tendo problemas com sintonizadores de TV há alguns anos, usei esse método para selecionar dois sintonizadores cuja presença / drivers não parecem ter causado falhas. Combinado com a minha falta de vontade de reiniciar para atualizações, muitas vezes tenho medições de tempo de atividade em semanas. (Muitas vezes, encontro o programa que está usando um arquivo que precisa ser substituído, feche-o e substitua-o manualmente - mesmo se o programa for Explorer)

Hugh Allen
fonte
2

Há quanto tempo você tem o computador? Poderia ser um problema de software? Antes de substituir o hardware, convém reinstalar o Windows de maneira limpa.

Earlz
fonte
O sistema está funcionando estável há cerca de um ano antes que isso acontecesse. Vale a pena tentar a reinstalação, mas se eu reconstruir, provavelmente substituirei o hw ao mesmo tempo.
pehrs