Como os engenheiros lidam com os ciclos de "reaprendizagem" da bateria do controlador RAID?
Como observado em: O que é uma "reaprendizagem de bateria" em um LSI MegaRaid? , o ciclo de reaprendizagem descarrega a bateria do controlador RAID (BBWC ou BBU), removendo a aceleração do cache de gravação. A vida útil da bateria é verificada e, uma vez carregada, o cache de gravação é reativado. Isso tem um impacto óbvio no desempenho de E / S do servidor durante o ciclo de reaprendizagem. Eu acho que isso ocorre mensalmente.
A degradação do desempenho foi observada, especialmente em sistemas de banco de dados:
Banco de dados lento? Verifique a bateria RAID!
Aprenda novamente sobre sua bateria
Meu histórico é em servidores HP ProLiant, cujos controladores Smart Array não passam por esse exercício ( ou pelo menos têm um monitoramento mais proativo da vida útil da bateria ). Esse parece ser um recurso terrível ( inconveniente máximo, pouco ganho ), mas estou em um ambiente com muitos controladores LSI (no hardware Supermicro ) e gostaria de ver se uma política geral pode ser aplicada aos sistemas relevantes.
- Qual é o agendamento padrão do ciclo de reaprendizado em um controlador LSI?
- Esses ciclos de reaprendizagem são úteis?
- Esse recurso deve ser desativado?
- Se você optar por deixar esse recurso ativado em seu ambiente, como você lida com o agendamento? Você agenda isso manualmente ou permite que o controlador defina seu próprio horário?
- Os controladores Dell Perc são afetados da mesma maneira? ( LSI é o OEM )
Respostas:
Recentemente, li um artigo de um dos engenheiros da Godaddy sobre esse mesmo tópico: Aprendendo a lidar com a aprendizagem
No seu hardware (placas Dell PERC), o ciclo de aprendizado da bateria acontece a cada 90 dias, mas não há como saber quando exatamente isso acontecerá, ou seja, durante os horários de pico ou fora de pico.
Eles falaram sobre diferentes soluções:
Desative completamente o aprendizado de bateria. O problema com esta opção é que você não saberá o status da sua bateria, por quanto tempo e quanto ela pode reter a carga, portanto, no caso de falta de energia, você pode arriscar a perda de dados.
Use hardware diferente. Alguns controladores têm 2 baterias e alternam entre eles durante esses ciclos de aprendizado. Além disso, existem controladores RAID (como o Dell H710) que não precisam de baterias, mas usam NVRAM não volátil para armazenar dados não confirmados.
Forçar write-back (armazenamento em cache), independentemente do status de suas baterias. Como a primeira solução, você está arriscando a perda de dados.
Por fim, eles configuram crons para horários fora de pico, que monitoram o próximo ciclo de aprendizado e, se for nas próximas 24 horas, forçam que isso aconteça imediatamente. Dessa forma, eles mantêm o benefício de exercitar as baterias, sem usá-las nos horários de pico.
fonte