Servidor de produção de monitoramento [fechado]

18

Temos 3 servidores dedicados, divididos em vários VPS usando openVZ. Estamos usando munin para monitorar o VPS com os locais de produção e monitorar alguns dos VPS para garantir que ele reinicie o serviço ao falhar.

O problema é que precisamos de uma maneira muito melhor de monitorar todos os nossos servidores, já que temos até 14 VPSes, gostaríamos de ter um hub central onde pudéssemos ver não apenas os dados coletados por munin, mas também algumas estatísticas extras nas redes e performances de nossos serviços.

Alguns de nossos requisitos:
- Notificação por SMS em caso de falha (capacidade de configurar determinadas verificações personalizadas)
- Analisador de log para o apache error_log e outros.
- Deve ser central (ou seja, um servidor e vários nós que coletam os dados).
- Não precisa ser fácil de instalar, mas fácil de manter.
- Precisa ser livre

Fui apontado para nagios e splunk, o que você acha? Obrigado,

Adam Benayoun
fonte

Respostas:

17

Eu tenho uma configuração semelhante, exceto com o Xen no lugar. Fiquei muito feliz com uma combinação de:

  • Nagios para alertar (usando PNP para alguns gráficos lite e Nagviz para um painel de estado de serviço)
  • Gânglios para gráficos históricos de sistemas
  • OSSEC como HIDS e igualmente importante como coletor para registro centralizado
    • sidenote: Existe um plug-in Splunk para OSSEC que integra muito bem essas duas ferramentas . No entanto, espero que elas sejam portadas para o Splunk v4.
  • Splunk Por último, uma vez que alguns dos plugins Splunk são migrados, que planeja usar o Splunk com alguns pré-filtragem de logs (para não ultrapassar o limite edições livres)

Espero que o compartilhamento da nossa configuração de monitoramento o ajude :-)

Aqui estão alguns links úteis:

http://www.ibm.com/developerworks/linux/library/l-ganglia-nagios-1/index.html

https://www.ibm.com/developerworks/linux/library/l-ganglia-nagios-2/

http://www.ossec.net/main/splunk-ossec-integration

atualizar:

Esqueci de mencionar que também usamos o layout de configuração de Matt Simmons Nagios, encontrado aqui http://www.standalone-sysadmin.com/blog/2009/07/nagios-config/

Esse layout tornou nossa Configuração do Nagios sã e muito mais fácil de manter (Obrigado Matt!)

servidor defeituoso
fonte
2
+1 para OSSEC + splunk. eles trabalham muito bem juntos.
sucuri
5

Eu tive grande sucesso com o Zabbix , ele satisfaz todos os seus pontos em um único pacote.

texto alternativo
(fonte: zabbix.com )

A parte mais difícil será obter o monitoramento do log do apache, mas o Zabbix é extensível para que você possa usar o LogWatch ou algum outro script perl para obter dados para você.

Dave Drager
fonte
2

Eu gosto do OpManager e é gratuito até um certo número de nós. Faz tudo isso e é muito fácil de instalar e manter.

FrangoLeiteBomb
fonte
1

Nagios deve ser uma boa escolha. Primeiro de tudo - é modular e satisfaz praticamente todas as suas expectativas. Além disso, recebeu alguns prêmios legais .

EDIT: Não se esqueça de verificar esta resposta .

minder
fonte