Usamos o Nagios para monitorar alguns servidores (~ 130). Monitoramos CPU, disco, RAM e algumas outras coisas em cada servidor. Eu sempre usei o SSH para executar os comandos remotos, simplesmente porque requer pouca ou nenhuma configuração adicional no servidor remoto, basta instalar o nagios-plugins, criar o usuário do nagios e adicionar a chave SSH, tudo que eu automatizei no um script de shell. Na verdade, nunca considerei as implicações de desempenho do uso do SSH sobre o NRPE.
Não estou muito preocupado com a carga atingida no servidor Nagios (provavelmente está superespecificado para o que faz, nunca ultrapassou 10% da CPU), mas executamos cada verificação remota a cada 30 segundos e cada servidor tem 5 verificações diferentes realizada. Presumo que o SSH exija mais recursos para cada verificação, mas há uma enorme diferença? (Ou seja, há diferença suficiente para justificar a mudança para NRPE).
Se for de alguma ajuda, monitoramos uma mistura de servidores físicos (normalmente com 8, 12 ou 16 núcleos físicos) e instâncias médias / grandes do Amazon EC2.
fonte
Além das sugestões fornecidas em outras respostas, você está pensando
ControlMaster
em ativar no arquivo .ssh / config do nagios para aproveitar ao máximo a multiplexação ssh ?Em outras palavras, sua conexão SSH "permaneceria", portanto a sobrecarga de estabelecê-la é mínima, pois isso aconteceria apenas uma vez. Isso ainda garantiria privacidade com criptografia e protegeria você de deixar portas TCP abertas nos servidores (embora com firewall). Além disso, você pode limitar o que um usuário faz via ssh, limitando os comandos que ele pode executar
fonte
Eu tive apenas problemas tentando compilar NRPE em vários sistemas operacionais. O SSH funcionou sem problemas e com eficiência e é muito mais fácil criar um script.
fonte