Qual é a estratégia para detectar desvio de tempo em um data center baseado em Linux?

14

Qual é a estratégia para detectar desvio de tempo em todos os data centers baseados em Linux? Esse é um problema mais difícil do que parece à primeira vista.

O desvio de tempo pode causar sérios problemas para certos aplicativos e, muitas vezes, embora o NTP esteja instalado, é possível falhar pelos seguintes motivos (e muitos mais):

  • O NTP não foi configurado corretamente para reiniciar automaticamente na reinicialização.
  • As configurações em um servidor estão incorretas; portanto, o servidor de horário para o qual ele aponta é inacessível ou impreciso.
  • O servidor de horário principal está inacessível e todos os servidores estão sincronizando com ele agora estão sendo sincronizados com uma fonte não confiável.

Eu gostaria de uma maneira de detectar se todos os servidores individuais estão corretos. Lembre-se de que o servidor com o script / aplicativo de teste pode não estar certo.

Stuart Woodward
fonte
6
Eu acho que seus motivos são falsos, o NTP operacional é fundamental para o farm. Verifique se o NTP está funcionando corretamente. Além disso, implante um relógio mestre local.
User539484
O NTP funciona imediatamente em muitas distribuições Linux agora com padrões sensatos. É praticamente um não-problema agora.
Matt

Respostas:

20

Isso é fácil de controlar. Gerenciamento de configuração é a chave ...

Verifique se o serviço ntp está em execução e configurado ...

Por exemplo, usar o Monit para garantir a ntpdexecução e reiniciá-lo se falhar é uma abordagem fácil ... Pode fazer sentido adicionar cron e outros daemons essenciais a esse tipo de verificação.

Outra opção é usar uma ferramenta de gerenciamento de configuração como o Puppet para forçar o mesmo ntpd.conf aos seus servidores e garantir que o ntpd esteja instalado, configurado e em execução.

Existem redundâncias suficientes no protocolo NTP para lidar com a instância de um servidor de horário inacessível. Especifique várias fontes.

ewwhite
fonte
3
Eu tenho que repetir esse sentimento. O gerenciamento de configuração e vários servidores NTP são partes bastante básicas da infraestrutura em qualquer coisa que se aproxime de um "data center". Um data center médio ou maior deve ter um relógio de hardware. As fontes de tempo do GPS podem ser adquiridas por algumas centenas, e se você tiver um ferro de soldar <$ 100.
Chris S
esta solução + nagios
aquele cara de lá
4
Observe que a maneira como você verifica ntpdo status é muito importante. Você não quer apenas dizer "o ntpd está funcionando. Está tudo ótimo!". Você deve realmente verificar se o seu sistema está sincronizando e tem um ponto funcional ou se o deslocamento de tempo é mínimo entre o host e a caixa de monitoramento . O Nagios possui check_ntp_peere check_ntp_timequal é o problema, se você quiser usar o Nagios.
precisa saber é o seguinte
ntpq para verificar o status
kubanczyk 9/09/13
10

Há uma variedade de plugins check_ntp para nagios por aí.

Aqui está um:

http://nagiosplugins.org/man/check_ntp

Adicione essa verificação ao host do nagios e receba alertas se algo der errado.

dmourati
fonte
Sim, basta configurar seu sistema de monitoramento para verificar se o tempo é válido ou, pelo menos, o deslocamento relativo ao sistema de monitoramento é mínimo.
Zoredache