Quais são os seus plugins Nagios mais úteis / valorizados? [fechadas]

33

Estamos expandindo nossa configuração do Nagios 3 e frequentemente encontramos novos plugins NRPE ou Nagios gerais para testar nossa infraestrutura existente. No entanto, isso é muito chato - seria útil obter um resumo dos plugins que os usuários do Nagios mais valorizam.

Liste um único plug-in por postagem, de preferência com uma breve descrição do motivo pelo qual você o ama e um link para o MonitoringExchange ou o site do desenvolvedor do plug-in. Dessa forma, as pessoas podem votar em plugins já listados e podemos vê-los em ordem preferencial.

Seria melhor não listar plug-ins que outros já mencionaram, pelo mesmo motivo. Se você tiver mais a adicionar em relação a um plug-in que outra pessoa listou, deixe um comentário na resposta.

Obrigado!

Mike Pountney
fonte

Respostas:

8

Em termos de flexibilidade, você não pode vencer o plug-in snmp. Está por trás de quase todas as verificações que executo e, se não for, a conexão TCP é.

Matt Simmons
fonte
A verificação snmp está ótima para o favorito nesta fase, Matt (e outros :) - você tem alguma técnica especial que utiliza? Minha principal discussão com o net-snmpd no momento é a complexidade da 'nova' funcionalidade de extensão em vez de execução - o check_snmpd lida com isso?
Mike Pountney
7

Nossos plugins mais úteis são aqueles que testam nossa funcionalidade superior do aplicativo. Por exemplo, temos testes que tentam entrar no site e testes que tentam enviar um email e marque uma caixa de correio pop3 para garantir que ele chegou. Se alguma dessas coisas quebrar, podemos usar verificações de nível inferior para ver o que está errado. O pop3 está morto? o MTA, o MDA? O servidor de banco de dados? o armazenamento de dados?

David Pashley
fonte
Wotcha Dave;) Você tem alguma dica de como conectar as verificações de nível superior e inferior? Por exemplo, como você cria uma dependência entre enviar um email e marcar a caixa pop3 para ver se está lá? É possível fazer isso puramente via Nagios, ou você está usando sua própria lógica?
Mike Pountney
Você está realmente acordado às 4 da manhã? :) O Nagios possui dependências de serviço, portanto você pode fazer com que sua verificação de email dependa das verificações smtp, MDA e POP3, mas isso significa apenas que a verificação de email não alerta se algum dos de nível inferior o faz. Isso fica muito mais difícil se você tiver um cluster de servidores fornecendo um serviço, pois não há como o nagios dizer "não nos avise sobre esse serviço se todos esses serviços estiverem mortos". Normalmente, confiamos apenas em saber como o sistema se encaixa para saber onde estão os problemas.
David Pashley
7

Honestamente, o que mais faz para mim é bastante antigo check_disk. Nada me faz sentir tão especial, dessa maneira "pare de comer a pasta", pois um servidor que estava funcionando bem ontem explodiu, correndo como um louco e depois descobrindo que é porque deixei os discos encherem. Nunca ter que fazer isso de novo na minha vida vale muito para mim.

(E não esqueça de verificar também os inodes, crianças assistindo em casa.)

caos
fonte
7

O WebInject é muito útil para monitorar sites, se você quiser ir além da funcionalidade check_http; ele pode lidar com páginas de login e executar várias etapas em uma verificação do Nagios.

gareth_bowles
fonte
4

Acho que check_nfsmount é útil em muitos dos meus servidores.

Edit: Eu também votaria no check_snmp se eu tivesse o representante para fazer isso. Está em uso em todos os meus servidores, além da lógica por trás do check_hpjd, que eu tenho em execução em todas as minhas impressoras HP.

steve.lippert
fonte
4

O mais útil é o que eu mesmo escrevi que verifica os certificados SSL em nossos servidores da web para manter um olho na expiração.

TCampbell
fonte
É publicado em algum lugar?
5179 RainyRat
4
check_http -H www.verisign.com -C 14
wittwerch
4

PNP (pnp4nagios.org) - gera gráficos no estilo RRD para qualquer verificação do Nagios que produza perf. dados. Incrivelmente útil, especialmente ao tentar convencer os desenvolvedores de que esse serviço recém-instalado é realmente a causa de todos esses picos de CPU ...

RainyRat
fonte
3

check_nt (conversando com o NSClient ou algo semelhante sobre o assunto) permite interrogar o WMI em uma caixa do Windows - se houver um contador de desempenho, agora você pode monitorá-lo com o Nagios.

RainyRat
fonte
E você pode acompanhar todos os seus serviços que estão sendo executados por exemplo, verificar se a troca ou servidor SQL estão em execução
Simon Foster
2

Esse é um plug sem vergonha, mas se você estiver monitorando máquinas Windows usando NRPE, o NagiosPluginsNT parece funcionar muito bem. ;-)

Mike
fonte
2

Concordo que o check_snmp é um plugin extremamente valioso; Ele pode ser usado para quase qualquer finalidade e tudo aparece no SNMP em geral. O SNMP está disponível em sistemas tão diversos quanto HP-UX, Tru64 e OpenVMS sem instalações adicionais.

Outro (não muito) plugin que é muito útil é o NagiosGrapher; Tenho minha experiência em um artigo que explica mais, mas também para que outros possam usá-lo sem nenhuma dificuldade que eu tenha experimentado.

Um último: NSCA. Você pode escrever um script Perl, Ruby ou ksh e alimentar a saída no NSCA.

Entre as flexibiidades do NSCA e do SNMP combinadas com os relatórios do NagiosGrapher, isso deve expandir seu monitoramento muito bem.

Mei
fonte
2

Eu gosto de check_http para verificar se meus sites ainda estão funcionando, eu o expandi para verificar se algum texto pode ser encontrado após uma vez em que minha empresa de hospedagem decidiu servir páginas em branco e minhas verificações do nagios passaram todas enquanto o servidor ainda estava em execução.

Simon Foster
fonte
2

O mais útil para mim é aquele que escrevi para minhas necessidades: nagios-check-webpage

Ele baixa uma página inteira com js / css / images, com multi-threads e gzip (economiza muita largura de banda), como navegadores reais.

Vincent
fonte
+1 De fato, esse plugin é incrível. Usá-lo para o aplicativo. 4 meses agora.
Henk
1

O número um é o NagiosWSC. Ele permite que você faça o monitoramento sem agente de hosts Windows através de WMI

Zypher
fonte
sem agente, mas com um grande ponto único de falha, ugh.
Toto
1

Uma que verifica a latência real para acessar sites e a procura por uma tag oculta 'status: ok'. Foi detectado um problema com o cache do squid e um problema no conjunto de idiomas que acontecia apenas uma vez a cada três noites às 3 da manhã, quando alguém acessava o site com um navegador que solicitava uma versão internacionalizada da página em idioma turco.

Sério, configure todo tipo de monitoramento possível. Os bugs e erros estranhos que você pode capturar em um ambiente complexo com um bom monitoramento são simplesmente incríveis. Além disso, registre seus dados de desempenho em um banco de dados rrd e exiba-os no Cacti.

Karl Katzke
fonte
1

Um dos plugins mais importantes é o que eu escrevi para mim: check_rdiff_backup. Faço backups no exterior e o Nagios me diz se e quando algo acontece com eles.

Se você está procurando pelo plug-in rdiff-backup, há um que você pode encontrar no Google.

zenek
fonte
1
Você conhece um para o rsnapshot?
Rory
1

check_curl para mim foi uma dádiva de Deus. Realmente fez a diferença na flexibilidade ao fazer verificações no site e também achei muito mais fácil do que o webinject, com quase todas as mesmas funcionalidades que eu precisava

à milanesa
fonte
1

Não é estritamente um plugin, mas fazer com que o twurl ( https://github.com/marcel/twurl ) funcione como um meio de acionar alertas foi uma dádiva absoluta. Não há necessidade de alertas por SMS e apenas satisfatório.

Detalhes sobre como isso foi feito: os alertas do Nagios usando o twitter (com twurl) não disparam - desculpas pela autopromoção desavergonhada;)

Outras coisas...

O Check_diskio ( https://trac.id.ethz.ch/projects/nagios_plugins/wiki/check_diskio ) foi incrivelmente útil em conjunto com as verificações padrão de carga da CPU e número do processo para determinar quando / se o IO está vinculado e de que maneira . O uso do nagiosgraph ( http://exchange.nagios.org/directory/Addons/Graphing-and-Trending/nagiosgraph/details ) torna ainda mais fácil.

jhackett
fonte
0

Centreon definitivamente para gráficos e todos os recursos do Nagios!

Antoine Benkemoun
fonte
0

check_multiprocs usado com o texto do link check_nrpe

Nicolas Marengo
fonte
0

Isso é meio que trapaça, porque eu desenvolvi bastante e realmente verifica muitas coisas diferentes ao mesmo tempo, mas o 'plugin' mais útil dos nagios para mim é o Resmon . É um agente que você executa no próprio servidor e o nagios se conecta através de http para executar as verificações. Eu acho que é semelhante ao que o nrpe faz, mas com várias decisões de design diferentes.

Marca
fonte
0

Eu tinha usado dois plugins .. um era para fornecer feed XML dos alertas e outro para enviar alertas via twitter. Ambos foram úteis (além dos plugins regulares). se você contar o NRPE como um plug-in, adicione-o também.

Ram Prasad
fonte
0

check_apt é muito legal e me lembra sobre atualizar meus servidores Debian.

zenek
fonte
0

Recentemente, comecei a usar o plug- in check_multi , usando um NRPE corrigido / aprimorado para saída grande (por causa das informações de desempenho e HTML).
É quase "um plugin para governar todos eles"! ;-)

Henk
fonte