O log de eventos do aplicativo continua sendo corrompido

8

Recentemente, perguntei sobre a reparação de um log de eventos corrompido , porque parecia ser um evento único. Desde então, o log de eventos exibiu o mesmo comportamento 3 vezes. Temos tentado encontrar padrões, mas até agora não encontramos nada. O servidor executa vários aplicativos ASP.NET e três tarefas agendadas escritas em .NET. A data da última modificação do log de eventos ocorreu uma vez ao mesmo tempo que uma das tarefas agendadas, mas as outras não.

Alguma sugestão de onde procurar em seguida ou uma maneira de obter informações de um arquivo evtx corrompido?

O servidor está executando aplicativos críticos de comércio eletrônico, portanto, queremos reduzir ao mínimo o número de reinicializações necessárias.

Edit: Eu corri DUMPEL e obtive resultados muito estranhos.

1/9/2012    4:14:05 PM  1   100 1000    Application Error       N/A SERVERNAME  Faulting application name: w3wp.exe, version: 7.5.7601.17514, time stamp: 0x4ce7a5f8  Faulting module name: ntdll.dll, version: 6.1.7601.17514, time stamp: 0x4ce7ba58  Exception code: 0xc0000374  Fault offset: 0x000ce653  Faulting process id: 0x1070  Faulting application start time: 0x01cccf1386d30991  Faulting application path: C:\Windows\SysWOW64\inetsrv\w3wp.exe  Faulting module path: C:\Windows\SysWOW64\ntdll.dll  Report Id: dbf4f691-3b06-11e1-9025-005056a602e6  
1/9/2012    4:14:07 PM  4   0   1001    Windows Error Reporting N/A SERVERNAME  Fault bucket , type 0  Event Name: APPCRASH  Response: Not available  Cab Id: 0    Problem signature:  P1: w3wp.exe  P2: 7.5.7601.17514  P3: 4ce7a5f8  P4: StackHash_79d9  P5: 6.1.7601.17514  P6: 4ce7ba58  P7: c0000374  P8: 000ce653  P9:   P10:     Attached files:  C:\Windows\Temp\WER975.tmp.appcompat.txt  C:\Windows\Temp\WERA03.tmp.WERInternalMetadata.xml  C:\Windows\Temp\WERA13.tmp.hdmp  C:\Windows\Temp\WERD21.tmp.mdmp    These files may be available here:  C:\ProgramData\Microsoft\Windows\WER\ReportQueue\AppCrash_w3wp.exe_cd7d09dfc84119d82a2ac6a789038bd5661acfb_cab_128f0e67    Analysis symbol:   Rechecking for solution: 0  Report Id: dbf4f691-3b06-11e1-9025-005056a602e6  Report Status: 4  
1/9/2012    4:14:07 PM  4   0   1001    Windows Error Reporting N/A SERVERNAME  Fault bucket , type 0  Event Name: APPCRASH  Response: Not available  Cab Id: 0    Problem signature:  P1: w3wp.exe  P2: 7.5.7601.17514  P3: 4ce7a5f8  P4: StackHash_79d9  P5: 6.1.7601.17514  P6: 4ce7ba58  P7: c0000374  P8: 000ce653  P9:   P10:     Attached files:  C:\Windows\Temp\WER975.tmp.appcompat.txt  C:\Windows\Temp\WERA03.tmp.WERInternalMetadata.xml  C:\Windows\Temp\WERA13.tmp.hdmp  C:\Windows\Temp\WERD21.tmp.mdmp    These files may be available here:  C:\ProgramData\Microsoft\Windows\WER\ReportQueue\AppCrash_w3wp.exe_cd7d09dfc84119d82a2ac6a789038bd5661acfb_cab_128f0e67    Analysis symbol:   Rechecking for solution: 0  Report Id: dbf4f691-3b06-11e1-9025-005056a602e6  Report Status: 0  
1/9/2012    4:14:12 PM  1   100 1000    Application Error       N/A SERVERNAME  Faulting application name: w3wp.exe, version: 7.5.7601.17514, time stamp: 0x4ce7a5f8  Faulting module name: ntdll.dll, version: 6.1.7601.17514, time stamp: 0x4ce7ba58  Exception code: 0xc0000374  Fault offset: 0x000ce653  Faulting process id: 0x16ac  Faulting application start time: 0x01cccf139f475c0c  Faulting application path: C:\Windows\SysWOW64\inetsrv\w3wp.exe  Faulting module path: C:\Windows\SysWOW64\ntdll.dll  Report Id: e03bae70-3b06-11e1-9025-005056a602e6  
1/9/2012    4:14:16 PM  4   0   1001    Windows Error Reporting N/A SERVERNAME  Fault bucket , type 0  Event Name: APPCRASH  Response: Not available  Cab Id: 0    Problem signature:  P1: w3wp.exe  P2: 7.5.7601.17514  P3: 4ce7a5f8  P4: StackHash_9c6c  P5: 6.1.7601.17514  P6: 4ce7ba58  P7: c0000374  P8: 000ce653  P9:   P10:     Attached files:  C:\Windows\Temp\WER2579.tmp.appcompat.txt  C:\Windows\Temp\WER25F7.tmp.WERInternalMetadata.xml  C:\Windows\Temp\WER25F8.tmp.hdmp  C:\Windows\Temp\WER28F6.tmp.mdmp    These files may be available here:  C:\ProgramData\Microsoft\Windows\WER\ReportQueue\AppCrash_w3wp.exe_c49a67649524ad11b64bbf809211bc5ba742a3d6_cab_0b63321b    Analysis symbol:   Rechecking for solution: 0  Report Id: e03bae70-3b06-11e1-9025-005056a602e6  Report Status: 4  
1/9/2012    4:14:16 PM  4   0   1001    Windows Error Reporting N/A SERVERNAME  Fault bucket , type 0  Event Name: APPCRASH  Response: Not available  Cab Id: 0    Problem signature:  P1: w3wp.exe  P2: 7.5.7601.17514  P3: 4ce7a5f8  P4: StackHash_9c6c  P5: 6.1.7601.17514  P6: 4ce7ba58  P7: c0000374  P8: 000ce653  P9:   P10:     Attached files:  C:\Windows\Temp\WER2579.tmp.appcompat.txt  C:\Windows\Temp\WER25F7.tmp.WERInternalMetadata.xml  C:\Windows\Temp\WER25F8.tmp.hdmp  C:\Windows\Temp\WER28F6.tmp.mdmp    These files may be available here:  C:\ProgramData\Microsoft\Windows\WER\ReportQueue\AppCrash_w3wp.exe_c49a67649524ad11b64bbf809211bc5ba742a3d6_cab_0b63321b    Analysis symbol:   Rechecking for solution: 0  Report Id: e03bae70-3b06-11e1-9025-005056a602e6  Report Status: 0  
1/9/2012    4:14:21 PM  1   100 1000    Application Error       N/A SERVERNAME  Faulting application name: w3wp.exe, version: 7.5.7601.17514, time stamp: 0x4ce7a5f8  Faulting module name: ntdll.dll, version: 6.1.7601.17514, time stamp: 0x4ce7ba58  Exception code: 0xc0000374  Fault offset: 0x000ce653  Faulting process id: 0x17f8  Faulting application start time: 0x01cccf13a4ba5126  Faulting application path: C:\Windows\SysWOW64\inetsrv\w3wp.exe  Faulting module path: C:\Windows\SysWOW64\ntdll.dll  Report Id: e57a0a85-3b06-11e1-9025-005056a602e6  
1/9/2012    4:14:21 PM  4   0   1001    Windows Error Reporting N/A SERVERNAME  Fault bucket , type 0  Event Name: APPCRASH  Response: Not available  Cab Id: 0    Problem signature:  P1: w3wp.exe  P2: 7.5.7601.17514  P3: 4ce7a5f8  P4: StackHash_9c6c  P5: 6.1.7601.17514  P6: 4ce7ba58  P7: c0000374  P8: 000ce653  P9:   P10:     Attached files:    These files may be available here:  C:\ProgramData\Microsoft\Windows\WER\ReportQueue\AppCrash_w3wp.exe_c49a67649524ad11b64bbf809211bc5ba742a3d6_1cfb4872    Analysis symbol:   Rechecking for solution: 0  Report Id: e57a0a85-3b06-11e1-9025-005056a602e6  Report Status: 4  
1/9/2012    4:14:21 PM  4   0   1001    Windows Error Reporting N/A SERVERNAME  Fault bucket , type 0  Event Name: APPCRASH  Response: Not available  Cab Id: 0    Problem signature:  P1: w3wp.exe  P2: 7.5.7601.17514  P3: 4ce7a5f8  P4: StackHash_9c6c  P5: 6.1.7601.17514  P6: 4ce7ba58  P7: c0000374  P8: 000ce653  P9:   P10:     Attached files:    These files may be available here:  C:\ProgramData\Microsoft\Windows\WER\ReportQueue\AppCrash_w3wp.exe_c49a67649524ad11b64bbf809211bc5ba742a3d6_1cfb4872    Analysis symbol:   Rechecking for solution: 0  Report Id: e57a0a85-3b06-11e1-9025-005056a602e6  Report Status: 0  

Nenhum dos arquivos referenciados realmente existe (nem mesmo no WER ReportArchive). Esses não devem ser os únicos eventos mencionados. O arquivo de log foi limpo duas vezes desde 9 de janeiro, portanto, esses eventos nem devem ser listados.

Atualização (14/06/2016):
não temos mais esse servidor e, portanto, não podemos mais testar as soluções propostas. Nunca descobrimos o que estava errado, mas transferimos todos os nossos serviços para novos servidores desde então.

yakatz
fonte
Meu primeiro passo seria tentar replicar isso em um ambiente que não seja de prod. Você pode configurar outro servidor com os mesmos aplicativos e ver se ele ocorre novamente ou configurar uma cópia da VM?
Sam Cogan
@ Sam Estou tentando conseguir os recursos necessários para isso.
yakatz
Você encontrou uma solução? por favor responda seu próprio quesiton. Obrigado
MacGyver
2
@ Leandro, não encontramos uma solução, mas parece que parou de acontecer recentemente por conta própria.
yakatz
O código no pool de aplicativos foi alterado desde que ocorreu originalmente? A saída do dumpel sugere que um dos pools de aplicativos estava travando e o relatório de erros estava verificando com a Microsoft o status dessa falha específica. Eu acho que houve uma exceção não detectada no código que estava travando o pool de aplicativos e que foi corrigido.
Nathan V

Respostas:

1

Surpreendeu que isso não tenha sido mencionado antes; Você verificou o sistema de arquivos? Se for um disco local e você pode aumentar o tempo de inatividade, sinalize o volume para um chkdsk e reinicie. Faça uma varredura de superfície, se possível.

Observe que isso consumirá muito tempo. Especialmente em um grande volume (+ 50gb). Atire para um fim de semana, se possível.

Signal15
fonte
Na verdade, é uma VM, portanto não temos acesso ao disco físico.
Yakatz
4
O fato de ser uma VM é irrelevante. Você pode ter corrupção no sistema de arquivos. Execute um 'chkdsk' durante seu próximo intervalo de inatividade / manutenção.
Signal15
0

Parece que você pode ter um problema com a corrupção do sistema de arquivos - uma boa maneira de verificar isso sem precisar reiniciar é executar:

sfc /scannow

E veja se você recebe várias correções ou erros. Se o fizer, o melhor próximo passo é reiniciar para executar um chkdsk para reparar suas partições e corrigir quaisquer erros nelas. Depois disso, se você ainda estiver com problemas, poderá precisar conversar com seu provedor sobre o hardware subjacente.

rtw
fonte
Esse servidor virtual não existe mais, então não posso testar nada de novo com esta pergunta, mas sei que o sistema de arquivos estava bom e que já havíamos executado sfcantes e não obtivemos nenhum erro.
Yakatz 14/06/16