Qual é o objetivo da bateria em um controlador RAID de cache com bateria, se o servidor estiver em uma fonte de alimentação ininterrupta?

10

A bateria é redundante se o servidor estiver em um no-break de tamanho adequado? Existe uma opção para forçar o modo de write-back e quero entender o risco. Entendo que ajuda a evitar falhas de energia enquanto os dados no cache não foram gravados no disco físico. Mas se o servidor estiver em um no-break, não haverá risco de perda de energia, especialmente se for um no-break inteligente e o servidor estiver configurado para desligar normalmente quando a bateria atingir um estado baixo. Estou esquecendo de algo?

RPC
fonte

Respostas:

22

Sua compreensão é essencialmente correta.

Permitir que o controlador armazene em cache dados de gravação em sua RAM local melhora a velocidade de gravação, no entanto, expõe o risco de que o sistema operacional pense que os dados foram gravados no disco (porque o controlador possui) e que a energia falha antes que o controlador conclua a gravação . O backup da bateria permite que os dados no cache sobrevivam até que a máquina seja ligada novamente, mitigando esse risco.

Quanto ao benefício, se o sistema já estiver em um no-break, o que acontece se você exceder o tempo de execução do no-break (possível mesmo com um no-break inteligente) ou se as fontes de alimentação do servidor explodirem? Ou se alguém acidentalmente arrancar os cabos de energia?
Muitas coisas podem causar uma falha de energia. Um no-break apenas protege contra alguns deles.

voretaq7
fonte
14
Os cabos de energia puxados repentinamente são um risco na maioria dos datacenters!
sysadmin1138
1
Bing em todos os pontos. O custo de um BBWC vale bem a pena, a menos que os dados sejam realmente transitórios, você pode capturar o evento e se recuperar de outra maneira e deseja melhorar o desempenho forçando o cache de write-back.
mfinni
3
Não há risco de perda de energia? Além das respostas do voretaq7, adicione: Disparo do disjuntor, mau funcionamento do no-break ... há muitas coisas que podem dar errado.
precisa saber é o seguinte
@mikeyB bom ponto sobre os disjuntores - eu estive em pelo menos um DC onde as pernas A / B de poder, ocasionalmente, voltou para um andar ou painel de disjuntores
voretaq7
Obrigado a todos por suas respostas. @ voretaq7 - o servidor também possui várias fontes de alimentação, vários cabos de energia, no-break e geradores, mas eu entendo o seu ponto em termos de design da própria placa (sem saber em que caixa ela pode acabar). @mfinni - essa é boa, mas teríamos problemas maiores com os milhares de servidores sendo desativados de uma só vez.
RPC
8

Existem duas razões para a bateria;

  • E se seus PSU / s de repente explodirem - independentemente de um no-break, seu sistema está inoperante e você pode ter dados não confirmados em seu cache, com a bateria garantindo que os dados sejam gravados corretamente quando a energia for restaurada. O mesmo é verdade se você teve uma falha na systemboard, é claro.
  • E se algo morresse no seu controlador de disco, cabos ou gabinete (s) de disco? - diga algo preso no cabo e danifique o conector em cada extremidade - novamente, você pode ter dados no cache aguardando para serem gravados, mas não há como fazê-lo, pois o cartão, o cabo, o gabinete etc. está morto. Pode ser necessário substituir o controlador, se você tiver um cache com bateria, poderá movê-lo para um novo cartão sem perder os dados.

Essas são duas boas razões, mas para ser sincero, os caches baseados em flash substituíram os suportados por bateria recentemente por razões óbvias e eu os recomendo primeiro - ou seja, se você escrever muito, recomendo um ou outro apenas um no-break.

Chopper3
fonte
-1

A bateria também permite a capacidade de obter o desempenho aprimorado, bem como os objetivos apontados pelo voretaq7. Retire a bateria e o dispositivo ainda funcionará, mas a uma velocidade substancialmente reduzida.

Mitch
fonte
3
Isso não está correto neste caso. O @RPC declara explicitamente que ele pode forçar o cache de write-back sem a bateria em seu controlador. O cache de write-back é o que melhora o desempenho.
mfinni
Na verdade, tenho certeza que ele pode, mas a bateria melhora substancialmente o desempenho. Eu trabalhei na solução de problemas de desempenho degradado em um par de dispositivos de armazenamento HP MSA 20 e a degradação foi causada por uma bateria com cache de write-back com falha. A bateria foi substituída e o desempenho aumentou.
Mitch
2
Sim eu conheço. Como nessas máquinas, a presença da bateria permite o cache de gravação. Quando a bateria falha, o armazenamento em cache de gravação é interrompido e o desempenho diminui. Quando a bateria está fixa, o cache de gravação começa novamente e o desempenho melhora. Seu controlador permite forçar o cache de write-back, que é o que melhora o desempenho , sem a bateria.
mfinni
Mitch, essa é uma preocupação muito específica. Conheço muito bem os controladores HP E / P / i e, para as placas, você está certo, pois a HP dificulta a ativação do cache sem bateria - mas essa pergunta não se limita a essas placas e existem muitas opções que permitem ativar o cache sem bateria ou de fato fazer isso por padrão - daí a preocupação do mfinni.
precisa saber é o seguinte
-1

Se você possui um no-break, pode forçar o cache e não usar a massa no ataque. Se você perder energia sem um cartão de invasão, poderá obter dados corrompidos, para isso servem os backups.

E só porque você perdeu energia, não significa que seu sistema está funcionando. O cache comporta apenas 256 megas e é liberado / gravado em HD o tempo todo quando ocioso. Não é como se ele contenha todos os dados e nunca o solte. Está sempre sendo liberado.

Um meteoro pode atingir o prédio e explodir tudo, não deixe que essas preocupações acabem com você. Eu executei o RAID 1 com cache ligado e sem bateria sem problemas.

Você pode ficar realmente anal nessa conversa. Por que não ter 4x cair sobre o servidor, 10x backups etc etc Não é tão grande coisa.

Ligue o cache e use seu no-break. Se você tiver um golpe ps, poderá recuperar os dados e eles deverão explodir durante o horário de trabalho com alguém que usa o computador e ter o aplicativo certo aberto, salvar os dados ao mesmo tempo, etc. acontece que pode ser corrigido facilmente.

RAJ
fonte