Foi-me dito para aceitar um erro com o Memtest86 +

52

Comprou um novo computador em agosto com 4x4 GB de RAM. Teve problemas com a RAM. Eles me enviaram quatro novos paus, o que também gerou erros. Destaque quatro paus (dos oito que eu tinha agora) que não geraram erros. Descoberto por coincidência um novo erro de RAM na semana passada (desta vez sem BSOD). Entrou em contato com a empresa. Segundo eles, houve um problema com um estoque ruim do último verão, então recebi dois cartões de 8 GB testados. Estive executando o Memtest86 + no fim de semana. Após 20 horas, recebi um erro (veja a foto em anexo). O teste já está em execução há 37 horas, mas até agora apenas este erro. Entrei em contato com a empresa onde comprei o computador. Eles escreveram de volta:

Eu não me preocuparia com o fato de alguém falhar.

Tivemos aqui situações semelhantes, nas quais passa inúmeras vezes, mas falha uma vez. Achamos que é um problema com o memtest, afinal a memória está com defeito ou não, então você não pode realmente passar algumas vezes, falhar na próxima vez e depois passar novamente!

Confie em mim e continue com a memória que lhe enviamos e, se seus problemas persistirem, procuraremos substituí-lo novamente.

De outras postagens do fórum, muitas pessoas não aceitam um único erro. O que esse erro único significa, RAM com defeito ou falha no programa MEMTEST (ou outro)?

Atualização: Dos comentários úteis abaixo, concluo que um erro "aleatório" ocasional (e raro) pode ocorrer e ser aceitável, mas erros repetidos no mesmo endereço indicam mau funcionamento. O Memtest já dura 45 horas e ainda tenho apenas um erro. Para informação de todos, continuarei executando o teste. Em menos de dois dias vou embora por um mês. Provavelmente deixarei o Memtest em execução. Como não tenho um no-break, existe o risco de uma queda de energia arruinar o experimento. O computador é uma área de trabalho, por isso não posso trazê-lo comigo (o que, curiosamente, o exporia a mais raios cósmicos, pois estarei voando;)).

Memtest

DustByte
fonte
+1; Pessoalmente, acho uma ótima pergunta, desculpe-me por não poder ajudar com uma resposta. Atualizei sua pergunta um pouco para garantir que ela não esteja fora do tópico!
Dave
19
Pessoalmente, eu não suaria uma, e apenas uma, falha ... a RAM sem correção de erros pode ocasionalmente ter um problema, não é perfeito. Agora, se você pode duplicar isso no mesmo intervalo de endereços, há algo errado com isso.
Shinrai 18/12/12
É bem simples. O erro que você postou significa que sua memória não está segurando o valor correto naquele determinado endereço
Ramhound
4
Tem certeza de que este não é o seu computador que corrompe sua memória RAM?
Sanny Sin
5
Concorde com @Shinrai - se não houvesse falhas intermitentes ocasionais com RAM normal, não haveria mercado para corrigir erros de RAM . Erros repetidos no mesmo endereço são outra questão, indicando uma célula de memória com defeito.
jg-faustus

Respostas:

41

Direto do autor do Memtest86. Eu os pressionaria para substituí-lo. Realmente não deve haver erros.

Se você tiver um número relativamente pequeno de endereços com falha e apenas um ou dois bits com erro, pode ter certeza de que os erros são válidos. Também erros intermitentes são válidos sem exceção. Frequentemente, os fornecedores de memória questionam se o Memtest86 suporta seu tipo de memória específico ou um chipset. O Memtest86 foi projetado para funcionar com todos os tipos de memória e todos os chipsets.

Todos os erros de memória válidos devem ser corrigidos. É possível que um erro específico nunca apareça na operação normal. No entanto, operar com memória marginal é arriscado e pode resultar em perda de dados e até corrupção de disco. Mesmo se não houver indicação clara de problemas, você não pode assumir que seu sistema não é afetado. Às vezes, erros intermitentes podem causar problemas que não aparecem por muito tempo. Você pode ter certeza de que Murphy o pegará se você souber de um erro de memória e o ignorar.

BroScience
fonte
4
Você deixou de fora a parte em que está implícita uma definição restrita de "válido": "Muitas vezes nos perguntam sobre a confiabilidade dos erros relatados pelo Mestest86. Na grande maioria dos casos, os erros relatados pelo teste são válidos. Existem alguns sistemas que causam O Memtest86 deve ficar confuso com o tamanho da memória e tentará testar a memória inexistente. Isso fará com que um grande número de endereços consecutivos sejam relatados como ruins e geralmente haverá muitos bits de erro. "
precisa
3
Ele quer dizer válido como em "erros intermitentes são erros reais, não um artefato do Memtest". Mas isso não significa necessariamente RAM defeituosa. Erros intermitentes de RAM acontecem, é por isso que existe uma RAM que corrige erros . O Google mediu isso em seus servidores: "um DIMM médio experimenta quase 4000 erros corrigíveis por ano" . Veja também ZDNet
jg-faustus
28

Parece que apenas um único bit está sendo corrompido (ou seja, não definido para a lógica 1 quando esperado) nesse endereço. Se você pode reproduzir o erro, a RAM está com defeito. Mesmo um erro reprodutível de 1 bit ainda é um erro e pode causar problemas ao usar o computador.

A memória funcionando corretamente * nunca ** deve ter erros, como o computador espera (e é por isso que eles travam quando a memória está ruim, como uma proteção; você não pode executar com segurança uma máquina com memória ruim, pois o computador pode executar corrompido instruções ou forneça / armazene dados corrompidos ).


* durante um período de tempo suficientemente longo, é possível que os bits DRAM sejam corrompidos de fontes externas, como radiação de fundo; o evento geralmente é tão raro na maioria dos computadores executa o Memtest por semanas sem erros. Veja também a pergunta Stack Overflow, " Cosmic Rays: qual é a probabilidade de que eles afetem um programa? ".

Avanço
fonte
Até agora, não há mais erros. O teste ainda está em execução. Nesse ponto, talvez seja apenas hipotético perguntar "e se esse for o único erro que recebo após executar o teste por uma semana?"
DustByte
6
@DustByte então eu diria que está tudo bem. Seria uma preocupação apenas se o mesmo erro acontecesse no mesmo local de memória, o que indicaria uma célula DRAM com defeito. Muitas coisas podem alterar a taxa de erro da RAM, incluindo radiação de fundo (por exemplo, tempestades de raios cósmicos ou outras fontes de radiação).
Breakthrough
5
em um exemplo, o Fermilab media 2,5 "perturbações de evento único" por dia em várias máquinas com 160 Gbits combinados. Eles atribuíram isso à radiação de fundo. Assuntos altitude neste caso: Boulder Colorado vai ver isso com mais frequência do que em Death Valley
horatio
Essa pergunta Stack Overflow foi muito perspicaz - Eu não sabia que a taxa de erro devido à radiação cósmica foi muito que alta.
Shinrai 18/12/12