Considerando o fato de que muitos sistemas de classe de servidor estão equipados com ECC RAM , é necessário ou útil gravar os DIMMs de memória antes de sua implantação?
Eu encontrei um ambiente em que toda a RAM do servidor é colocada através de um longo processo de queima / estresse. Isso atrasou a implantação do sistema ocasionalmente e afeta o tempo de execução do hardware.
O hardware do servidor é principalmente Supermicro ; portanto, a RAM é proveniente de uma variedade de fornecedores; não diretamente do fabricante, como um Dell Poweredge ou HP ProLiant .
Este exercício é útil? Na minha experiência anterior, simplesmente usei a RAM do fornecedor imediatamente. Os testes de memória do POST não devem capturar a memória DOA? Respondi a erros de ECC muito antes de um DIMM realmente falhar, pois os limites do ECC eram geralmente o gatilho para a colocação da garantia.
- Você queima sua RAM?
- Em caso afirmativo, quais métodos você usa para executar os testes?
- Identificou algum problema antes da implantação?
- O processo de gravação resultou em alguma estabilidade adicional da plataforma, em vez de não executar essa etapa?
- O que você faz ao adicionar RAM a um servidor em execução existente?
fonte
Não.
O objetivo da gravação no hardware é enfatizá-lo a ponto de catalisar uma falha em um componente.
Fazer isso com discos rígidos mecânicos obterá alguns resultados, mas isso não fará muito pela RAM. A natureza do componente é tal que fatores e idade ambientais são muito mais propensos a ser a causa de falhas do que a leitura e gravação na RAM (mesmo em sua largura de banda máxima por algumas horas ou dias).
Supondo que sua RAM tenha qualidade alta o suficiente para que a solda não derreta na primeira vez em que você realmente começar a usá-la, um processo de gravação não ajudará a encontrar defeitos.
fonte
Compramos lâminas e geralmente compramos um bloco razoavelmente grande de cada vez; portanto, as colocamos e instalamos durante DAYS antes que nossas portas de rede estejam prontas / seguras. Portanto, usamos esse tempo para usar o memtest por cerca de 24 horas, às vezes mais se passar um fim de semana - depois disso, pulverizamos o ESXi básico e o IP está pronto para que o perfil do host seja aplicado quando a rede estiver ativa. Então, sim, nós o testamos, mais por oportunidade do que por necessidade, mas capturou alguns DIMMs de DOA até agora, e não sou eu que faço isso fisicamente, então não me esforço. Eu sou a favor.
fonte
Bem, acho que depende exatamente de quais são seus processos. SEMPRE executo o MemTest86 na memória antes de colocá-lo em um sistema (servidor ou não). Depois de ter um sistema instalado e funcionando, os problemas causados pela memória defeituosa podem ser difíceis de solucionar.
Quanto a realmente "testar o estresse" da memória; Ainda não entendi por que isso seria útil, a menos que você esteja testando para fins de overclock.
fonte
Não, mas já vi pessoas que o fazem. Eu nunca os vi ganhar nada com isso, acho que pode ser uma ressaca ou superstição, talvez.
Pessoalmente, sou como você porque as taxas de erro do ECC são mais úteis para mim - supondo que a RAM não seja DOA, mas você saberia disso de qualquer maneira.
fonte
Para ram não-ECC, executar 30 minutos no memtest86 + é útil, pois geralmente não existe um método confiável para detectar erros de bit quando o sistema está em execução.
A triagem azul não é considerada um método confiável ...
E a RAM levemente esquisita geralmente não aparece imediatamente, somente depois que o sistema vê uma carga de memória cheia e somente se os dados nessa RAM eram um código usado e então caiu. A corrupção de dados pode passar despercebida por longos períodos de tempo.
Para a ram ECC, ele não fará nada que o próprio controlador de memória não fará, por isso realmente não faz sentido. É apenas uma perda de tempo.
Na minha experiência, as pessoas que insistem em se interessar geralmente são caras velhos que sempre fizeram isso e continuam fazendo isso por hábito, sem realmente pensar nas coisas verdadeiras.
Ou são rapazes jovens, seguindo o procedimento prescrito escrito por esses homens velhos.
fonte
Depende.
Se você está implantando 50.000 novas RAMs e sabe que esse hardware específico tem uma taxa de falhas de 0,01% após operar menos de um dia, estatisticamente falando, existem várias delas que falharão no primeiro dia. Queimar é para entender isso. Com implantações nessa escala, espera-se falha, não uma situação excepcional.
No entanto, se você estiver implantando apenas algumas centenas de itens, as estatísticas provavelmente ficarão do seu lado, pois você deverá ter muita sorte para obter as peças com falha.
fonte