Por isso, rodamos o Groundworks (com Nagios) no CentOS para monitorar nossos vários servidores e processos. Eu tenho a configuração para enviar automaticamente e-mails e textos SMS quando as coisas atingirem um estado AVISO ou CRÍTICO. Normalmente isso funciona perfeitamente. No entanto, duas vezes tivemos problemas com o Postfix no servidor em que o Postfix decide parar de enviar email. O período mais recente durou 4 dias porque nenhum de nós percebeu.
Isso me leva a uma pergunta importante: como devo monitorar meu servidor de monitoramento?
Respostas:
Com um segundo servidor de monitoramento, é claro. O segundo pode ser muito mais simples, pois basta monitorar o primeiro. E deve ser monitorado pelo principal sistema de monitoramento, por sua vez, é claro.
Se o seu grupo fizer parte de uma organização maior, com infra-estruturas de TI separadas, você poderá fazer acordos para que o serviço de monitoramento de outro grupo assista ao seu.
Você também pode garantir que o servidor envie uma mensagem "está tudo bem" todos os dias e adquira o hábito de procurá-la. (Isso só é eficaz se você ainda não estiver sobrecarregado com mensagens de rotina, é claro.)
fonte
Outras pessoas sugerem o envio de mensagens regulares dizendo que tudo está bem, mas pessoalmente não concordo com isso. O monitoramento deve ser silencioso, a menos que haja um problema, e nunca se deve confiar em que um usuário perceba que algo está errado, como "Ah, eu não recebo esse email diariamente há alguns dias". Especialmente se você tiver mais de uma pessoa respondendo a alertas, cada uma pode pensar que a outra já removeu a mensagem diária "Estou bem".
Temos um serviço externo (dos quais existem centenas, mas usamos wormly ) para fazer verificações HTTP do nosso servidor de monitoramento para garantir que ele funcione e possa acessar a Internet. Essa é a nossa principal preocupação em monitorá-lo. Em seguida, nosso servidor Nagios monitora todos os servidores Nagios de nossos clientes.
Mas você traz um bom argumento. Provavelmente, devemos adicionar uma URL HTTP que verifique a fila de postfix e, se ela mostrar um número incomum de mensagens, o que provavelmente significa que ela tem alguma na fila, em seguida, gere um alerta. Outra opção seria usar métodos diferentes para alertas, digamos, um agente de entrega de SMS não SMTP e SMTP que usamos atualmente.
No entanto, no nosso caso, não me lembro que já tivemos o servidor de correio morto. Obviamente, todo esse servidor de email é usado para enviar alertas do Nagios, portanto a configuração é muito simples e quase nunca muda.
fonte
Obviamente, seu postfix também deve ser monitorado, mas esse é outro tópico;)
Eu uso o plugin Nagios checker para o Firefox , ele está sempre sendo executado em uma barra de status em qualquer computador que eu use regularmente.
Além disso, tenho um script personalizado no host externo que envia um ping ao host do nagios e envia um SMS se ele não estiver respondendo aos ping.
Até agora (mais de 5 anos) funcionou bem (bata na madeira).
fonte
Para monitorar o monitoramento do servidor (nagios no nosso caso), o plano gratuito ou básico do Pingdom ou alertfox funciona muito bem.
fonte
Primeira coisa: deixe enviar mensagens "estou vivo" uma ou duas vezes por dia. Segundo, eu executo uma máquina antiga apenas para esse fim, que possui outro modem GSM, um pequeno no-break etc. e uma conexão (direta) dedicada ao servidor de monitoramento primário. Este também ajuda no ponto três: Verifique o status de seus sistemas de monitoramento regularmente. O pequeno sistema de monitoramento auxiliar exibe a página de status do sistema primário em meu escritório o tempo todo.
fonte
Se o seu servidor de Monitoramento estiver acessível pela Internet, você deverá monitorá-lo por um provedor externo (por exemplo, websitepulse et. Al.).
fonte