Estamos expandindo nossa configuração do Nagios 3 e frequentemente encontramos novos plugins NRPE ou Nagios gerais para testar nossa infraestrutura existente. No entanto, isso é muito chato - seria útil obter um resumo dos plugins que os usuários do Nagios mais valorizam.
Liste um único plug-in por postagem, de preferência com uma breve descrição do motivo pelo qual você o ama e um link para o MonitoringExchange ou o site do desenvolvedor do plug-in. Dessa forma, as pessoas podem votar em plugins já listados e podemos vê-los em ordem preferencial.
Seria melhor não listar plug-ins que outros já mencionaram, pelo mesmo motivo. Se você tiver mais a adicionar em relação a um plug-in que outra pessoa listou, deixe um comentário na resposta.
Obrigado!
fonte
Nossos plugins mais úteis são aqueles que testam nossa funcionalidade superior do aplicativo. Por exemplo, temos testes que tentam entrar no site e testes que tentam enviar um email e marque uma caixa de correio pop3 para garantir que ele chegou. Se alguma dessas coisas quebrar, podemos usar verificações de nível inferior para ver o que está errado. O pop3 está morto? o MTA, o MDA? O servidor de banco de dados? o armazenamento de dados?
fonte
Honestamente, o que mais faz para mim é bastante antigo
check_disk
. Nada me faz sentir tão especial, dessa maneira "pare de comer a pasta", pois um servidor que estava funcionando bem ontem explodiu, correndo como um louco e depois descobrindo que é porque deixei os discos encherem. Nunca ter que fazer isso de novo na minha vida vale muito para mim.(E não esqueça de verificar também os inodes, crianças assistindo em casa.)
fonte
O WebInject é muito útil para monitorar sites, se você quiser ir além da funcionalidade check_http; ele pode lidar com páginas de login e executar várias etapas em uma verificação do Nagios.
fonte
Acho que check_nfsmount é útil em muitos dos meus servidores.
Edit: Eu também votaria no check_snmp se eu tivesse o representante para fazer isso. Está em uso em todos os meus servidores, além da lógica por trás do check_hpjd, que eu tenho em execução em todas as minhas impressoras HP.
fonte
O mais útil é o que eu mesmo escrevi que verifica os certificados SSL em nossos servidores da web para manter um olho na expiração.
fonte
PNP (pnp4nagios.org) - gera gráficos no estilo RRD para qualquer verificação do Nagios que produza perf. dados. Incrivelmente útil, especialmente ao tentar convencer os desenvolvedores de que esse serviço recém-instalado é realmente a causa de todos esses picos de CPU ...
fonte
check_nt (conversando com o NSClient ou algo semelhante sobre o assunto) permite interrogar o WMI em uma caixa do Windows - se houver um contador de desempenho, agora você pode monitorá-lo com o Nagios.
fonte
Esse é um plug sem vergonha, mas se você estiver monitorando máquinas Windows usando NRPE, o NagiosPluginsNT parece funcionar muito bem. ;-)
fonte
Concordo que o check_snmp é um plugin extremamente valioso; Ele pode ser usado para quase qualquer finalidade e tudo aparece no SNMP em geral. O SNMP está disponível em sistemas tão diversos quanto HP-UX, Tru64 e OpenVMS sem instalações adicionais.
Outro (não muito) plugin que é muito útil é o NagiosGrapher; Tenho minha experiência em um artigo que explica mais, mas também para que outros possam usá-lo sem nenhuma dificuldade que eu tenha experimentado.
Um último: NSCA. Você pode escrever um script Perl, Ruby ou ksh e alimentar a saída no NSCA.
Entre as flexibiidades do NSCA e do SNMP combinadas com os relatórios do NagiosGrapher, isso deve expandir seu monitoramento muito bem.
fonte
Eu gosto de check_http para verificar se meus sites ainda estão funcionando, eu o expandi para verificar se algum texto pode ser encontrado após uma vez em que minha empresa de hospedagem decidiu servir páginas em branco e minhas verificações do nagios passaram todas enquanto o servidor ainda estava em execução.
fonte
O mais útil para mim é aquele que escrevi para minhas necessidades: nagios-check-webpage
Ele baixa uma página inteira com js / css / images, com multi-threads e gzip (economiza muita largura de banda), como navegadores reais.
fonte
O número um é o NagiosWSC. Ele permite que você faça o monitoramento sem agente de hosts Windows através de WMI
fonte
Uma que verifica a latência real para acessar sites e a procura por uma tag oculta 'status: ok'. Foi detectado um problema com o cache do squid e um problema no conjunto de idiomas que acontecia apenas uma vez a cada três noites às 3 da manhã, quando alguém acessava o site com um navegador que solicitava uma versão internacionalizada da página em idioma turco.
Sério, configure todo tipo de monitoramento possível. Os bugs e erros estranhos que você pode capturar em um ambiente complexo com um bom monitoramento são simplesmente incríveis. Além disso, registre seus dados de desempenho em um banco de dados rrd e exiba-os no Cacti.
fonte
Um dos plugins mais importantes é o que eu escrevi para mim: check_rdiff_backup. Faço backups no exterior e o Nagios me diz se e quando algo acontece com eles.
Se você está procurando pelo plug-in rdiff-backup, há um que você pode encontrar no Google.
fonte
check_curl para mim foi uma dádiva de Deus. Realmente fez a diferença na flexibilidade ao fazer verificações no site e também achei muito mais fácil do que o webinject, com quase todas as mesmas funcionalidades que eu precisava
fonte
Não é estritamente um plugin, mas fazer com que o twurl ( https://github.com/marcel/twurl ) funcione como um meio de acionar alertas foi uma dádiva absoluta. Não há necessidade de alertas por SMS e apenas satisfatório.
Detalhes sobre como isso foi feito: os alertas do Nagios usando o twitter (com twurl) não disparam - desculpas pela autopromoção desavergonhada;)
Outras coisas...
O Check_diskio ( https://trac.id.ethz.ch/projects/nagios_plugins/wiki/check_diskio ) foi incrivelmente útil em conjunto com as verificações padrão de carga da CPU e número do processo para determinar quando / se o IO está vinculado e de que maneira . O uso do nagiosgraph ( http://exchange.nagios.org/directory/Addons/Graphing-and-Trending/nagiosgraph/details ) torna ainda mais fácil.
fonte
Bem, os simples, simples e padrão - check_disk, check_load, check_http são perfeitos o suficiente para a maioria dos casos (principalmente queremos saber se servidores, sites estão em funcionamento, certo)
e além de check_disk e check_swap, existe um check_memory http://exchange.nagios.org/directory/Plugins/Uncategorized/Operating-Systems/Linux/check_memory/details que fornece o uso da memória ...
fonte
Centreon definitivamente para gráficos e todos os recursos do Nagios!
fonte
check_multiprocs usado com o texto do link check_nrpe
fonte
Isso é meio que trapaça, porque eu desenvolvi bastante e realmente verifica muitas coisas diferentes ao mesmo tempo, mas o 'plugin' mais útil dos nagios para mim é o Resmon . É um agente que você executa no próprio servidor e o nagios se conecta através de http para executar as verificações. Eu acho que é semelhante ao que o nrpe faz, mas com várias decisões de design diferentes.
fonte
Eu tinha usado dois plugins .. um era para fornecer feed XML dos alertas e outro para enviar alertas via twitter. Ambos foram úteis (além dos plugins regulares). se você contar o NRPE como um plug-in, adicione-o também.
fonte
check_apt é muito legal e me lembra sobre atualizar meus servidores Debian.
fonte
Recentemente, comecei a usar o plug- in check_multi , usando um NRPE corrigido / aprimorado para saída grande (por causa das informações de desempenho e HTML).
É quase "um plugin para governar todos eles"! ;-)
fonte