Temos 3 servidores dedicados, divididos em vários VPS usando openVZ. Estamos usando munin para monitorar o VPS com os locais de produção e monitorar alguns dos VPS para garantir que ele reinicie o serviço ao falhar.
O problema é que precisamos de uma maneira muito melhor de monitorar todos os nossos servidores, já que temos até 14 VPSes, gostaríamos de ter um hub central onde pudéssemos ver não apenas os dados coletados por munin, mas também algumas estatísticas extras nas redes e performances de nossos serviços.
Alguns de nossos requisitos:
- Notificação por SMS em caso de falha (capacidade de configurar determinadas verificações personalizadas)
- Analisador de log para o apache error_log e outros.
- Deve ser central (ou seja, um servidor e vários nós que coletam os dados).
- Não precisa ser fácil de instalar, mas fácil de manter.
- Precisa ser livre
Fui apontado para nagios e splunk, o que você acha? Obrigado,
fonte
Eu tive grande sucesso com o Zabbix , ele satisfaz todos os seus pontos em um único pacote.
(fonte: zabbix.com )
A parte mais difícil será obter o monitoramento do log do apache, mas o Zabbix é extensível para que você possa usar o LogWatch ou algum outro script perl para obter dados para você.
fonte
Eu gosto do OpManager e é gratuito até um certo número de nós. Faz tudo isso e é muito fácil de instalar e manter.
fonte
Nagios deve ser uma boa escolha. Primeiro de tudo - é modular e satisfaz praticamente todas as suas expectativas. Além disso, recebeu alguns prêmios legais .
EDIT: Não se esqueça de verificar esta resposta .
fonte