O servidor Zabbix envia muitas notificações

9

Instalei recentemente o servidor Zabbix em um VPS e estou muito feliz com ele. Eu instalei o cliente em appr. 6-7 outros VPSs e tudo funciona bem. A interface é suave e produz alguns gráficos muito bons.
Meu único problema com o software é que eu o configurei para enviar notificações sobre problemas, mas estou recebendo entre 30 e 60 e-mails todos os dias. Sempre algo junto ao "Servidor XXX está inacessível: PROBLEMA" e um minuto depois: "Servidor XXX está inacessível: OK". Obviamente, o Zabbix também reconhece quando há problemas reais e, por exemplo, quando um servidor foi reiniciado. Parece-me que o Zabbix "desiste" muito rapidamente, ou talvez se esgote mais rapidamente do que o que se adapta às minhas necessidades. Eu tenho tentado pesquisar no google esse problema várias vezes, mas desisti, agora estou tentando essa abordagem.

Alguém sabe como ajustar a fidelidade dessas notificações / gatilhos?

anselmdk
fonte
você está usando os modelos de exemplo padrão? se assim for, mais provável é o item "status", que, na verdade, não é sugerido :) - você deve mudar em vez de agent.ping para verificar a disponibilidade de acolhimento
Richlv

Respostas:

9

https://www.zabbix.com/documentation/1.8/manual/escalations_and_repeated_notifications/delayed_notifications Estou usando a funcionalidade de escalação do Zabbix para suprimir mensagens frequentes de ativação / desativação. Em geral:

  • as primeiras mensagens acionam a cadeia de escalação, sem enviar e-mail a você
  • então, o Zabbix aguarda 5 minutos (ou o que você configurar) antes de enviar uma notificação.
  • se durante esses 5 minutos acionar as alterações de estado para desativado, você não receberá nenhuma notificação e tudo voltará ao normal.
  • Boa parte que deshboard ainda mostra

Oleg

OlegBrrr
fonte
Obrigado! Parece o que eu estava procurando. Ajustei as configurações e agora estou dando um tempo ao sistema para ver como o envio da notificação é afetado.
### anselmdk #
Depois de esperar pacientemente (e relaxar alguns gatilhos da web), os emails do Zabbix finalmente estão funcionando corretamente agora. Obrigado pela dica!
anselmdk
5

Você pode ajustar os gatilhos também. Eu achei o método count () útil.
Em vez de acionar o último (0), tente a contagem (300,0, "eq")}> 5. Isso aciona uma exceção se as últimas 5 verificações (assumindo 60 segundos entre as verificações) falharem.

http://www.zabbix.com/documentation/1.8/manual/config/triggers

Você também pode desativar as mensagens OK adicionando a condição 'Trigger value = "PROBLEM"'. Essa alteração deve ser feita na configuração das ações.

http://www.zabbix.com/documentation/1.8/manual/config/actions

serverSentinel
fonte
2
Na verdade, seu exemplo de contagem retornará o número de valores nos últimos 300 segundos igual a 0. Você o comparará a 5. O efeito geral é acionar um evento se 5 ou mais valores "0" ocorrerem nos últimos 300 segundos.
G-Wiz #