É importante ter módulos de memória ECC em um servidor não crítico?
Eu estava pensando em conseguir um servidor dedicado para muitas coisas aleatórias e não críticas. Reinicializações esporádicas não são grande coisa. Estou procurando um fornecedor, mas os preços são incrivelmente baratos. Seu hardware soa como uma piada para qualquer caixa séria de servidor: processadores de desktop, RAM não ECC, chassi sem nome, disco rígido SATA com hotswap etc. (bem, o preço justifica, eu acho).
Eu considero a memória ECC como garantida em qualquer servidor "sério", por isso estou me perguntando se é um grande problema ou não para dispositivos "de brinquedo".
Respostas:
Os dados publicados pela equipe de TI do CERN ( Data Integrity ) sugerem que a quantidade de erros provenientes da RAM é bastante baixa. Você ainda precisa ponderar seus dados e o custo do hardware.
Você pode ler um pouco mais sobre isso no StorageMojo .
fonte
A RAM do ECC basicamente ajuda a evitar erros que ocorrem ao ler e gravar na RAM. A chance de realmente haver um erro é muito pequena, mas diferente de zero. Eu diria que, se você não estiver fazendo tarefas críticas, poderá fugir sem a RAM do ECC - como eu disse, as chances de encontrar um erro que o ECC impediria são muito, muito pequenas.
fonte
O que é um servidor não crítico? Um que pode falhar?
A RAM do ECC é fundamental quando a confiabilidade da memória é fundamental.
Duas coisas crescem com o aumento do tamanho da memória:
Esta apresentação da intel no ECC relata os seguintes fatos:
Outra pesquisa recente do WISC mostra que o ECC é essencial para esses sistemas ZFS:
É importante observar que outros sistemas de arquivos são tão sensíveis a essa forma de corrupção de dados quanto o ZFS.
O ECC é o que evita que você se depare com esses problemas, quando possível e, em casos desastrosos, o que avisa sobre isso antes que seja tarde demais.
fonte
Simplesmente não é tão importante. Se você precisasse de 99,999% de tempo de atividade, se preocuparia. Fora isso, você reiniciará com mais frequência do que erros de memória.
fonte
Este estudo realizado pelo Google em 2009 encontrou uma taxa de erro entre 25000 e 70000 erros por bilhão de horas de dispositivo por megabit. Isso significa que, para 8GiB de RAM (usada), ocorreram aproximadamente 1,7 a 4,8 erros por hora.
Bitflips são algo que existe e não deve ser ignorado assim que a integridade dos dados for importante.
No seu caso (coisas aleatórias e não críticas), provavelmente seria um exagero.
fonte