Gerenciando ciclos de reaprendizagem de bateria em controladores LSI e RAID similares

12

Como os engenheiros lidam com os ciclos de "reaprendizagem" da bateria do controlador RAID?

Como observado em: O que é uma "reaprendizagem de bateria" em um LSI MegaRaid? , o ciclo de reaprendizagem descarrega a bateria do controlador RAID (BBWC ou BBU), removendo a aceleração do cache de gravação. A vida útil da bateria é verificada e, uma vez carregada, o cache de gravação é reativado. Isso tem um impacto óbvio no desempenho de E / S do servidor durante o ciclo de reaprendizagem. Eu acho que isso ocorre mensalmente.

A degradação do desempenho foi observada, especialmente em sistemas de banco de dados:

Banco de dados lento? Verifique a bateria RAID!

Aprenda novamente sobre sua bateria

Meu histórico é em servidores HP ProLiant, cujos controladores Smart Array não passam por esse exercício ( ou pelo menos têm um monitoramento mais proativo da vida útil da bateria ). Esse parece ser um recurso terrível ( inconveniente máximo, pouco ganho ), mas estou em um ambiente com muitos controladores LSI (no hardware Supermicro ) e gostaria de ver se uma política geral pode ser aplicada aos sistemas relevantes.

  • Qual é o agendamento padrão do ciclo de reaprendizado em um controlador LSI?
  • Esses ciclos de reaprendizagem são úteis?
  • Esse recurso deve ser desativado?
  • Se você optar por deixar esse recurso ativado em seu ambiente, como você lida com o agendamento? Você agenda isso manualmente ou permite que o controlador defina seu próprio horário?
  • Os controladores Dell Perc são afetados da mesma maneira? ( LSI é o OEM )
ewwhite
fonte
Não posso falar com o resto da pergunta, mas os PERCs reaprendem.
precisa saber é o seguinte
Os controladores LSI mais recentes devem ter uma opção de 'reaprendizagem transparente'. Na prática (no hardware da classe Dell C), eu não vi esse trabalho.
Toplaywagon

Respostas:

13

Recentemente, li um artigo de um dos engenheiros da Godaddy sobre esse mesmo tópico: Aprendendo a lidar com a aprendizagem

No seu hardware (placas Dell PERC), o ciclo de aprendizado da bateria acontece a cada 90 dias, mas não há como saber quando exatamente isso acontecerá, ou seja, durante os horários de pico ou fora de pico.

Eles falaram sobre diferentes soluções:

  • Desative completamente o aprendizado de bateria. O problema com esta opção é que você não saberá o status da sua bateria, por quanto tempo e quanto ela pode reter a carga, portanto, no caso de falta de energia, você pode arriscar a perda de dados.

  • Use hardware diferente. Alguns controladores têm 2 baterias e alternam entre eles durante esses ciclos de aprendizado. Além disso, existem controladores RAID (como o Dell H710) que não precisam de baterias, mas usam NVRAM não volátil para armazenar dados não confirmados.

  • Forçar write-back (armazenamento em cache), independentemente do status de suas baterias. Como a primeira solução, você está arriscando a perda de dados.

Por fim, eles configuram crons para horários fora de pico, que monitoram o próximo ciclo de aprendizado e, se for nas próximas 24 horas, forçam que isso aconteça imediatamente. Dessa forma, eles mantêm o benefício de exercitar as baterias, sem usá-las nos horários de pico.

Mxx
fonte