Eu sei que algumas grandes empresas, como IBM, Amazon e governos, exigem um alto grau de disponibilidade e retenção de dados com seus servidores. Para conseguir isso, eles usam redundância. Minha pergunta é: quais componentes de um servidor (e cluster) geralmente são redundantes? Eu tinha trabalhado brevemente em tal sala de servidores e notei redundância em coisas como
- suprimentos de energia
- RAID foi usado com um mínimo de 10 discos e geralmente tinha hot spare
- placas de rede
- os cartões de rede em si tinham várias portas Ethernet
- Backup UPS
- gerador de diesel
O que mais é comum em redundância? Eu sei que um servidor inteiro pode ser espelhado. Qualquer componente de computador pode ser redundante, por exemplo, computadores possuem várias CPUs atualmente, mas eu acho que você não consideraria isso redundante, já que todos estão sendo usados de uma só vez, então a chance de falha é equivalente a todos eles, eu entendo está certo? A memória pode ser redundante?
Eu estaria interessado em ver estatísticas para qual parte de um servidor falha com mais freqüência.
fonte
Respostas:
Qualquer parte de um servidor pode ser redundante, mas pode haver compensações significativas que podem ser desmembramentos - dependendo do que você está fazendo -
O maior deles, em muitos casos, é o de sites redundantes - mesmo que você tenha dois PCs se eles estiverem distantes um do outro, a latência pode prejudicar seu IO.
Entrando nos dispositivos -
Você não pode realmente tornar a memória redundante, mas você pode usar a memória ECC para maior integridade.
Você não pode ter placas-mãe redundantes - isso realmente significa 2 computadores.
Você não pode realmente ter CPUs redundantes, embora você possa ter várias CPUs e desativar uma que não tenha desempenho.
A parte de um computador para falhar mais frequentemente é o disco rígido - por um longo caminho. Falhas de memória também são bastante comuns.
fonte