Ultimamente, tenho enfrentado algum tempo de inatividade em alguns sites do Drupal que implantei. Eu gostaria de abordar o problema proativamente, em vez de reagir a esses períodos de inatividade reiniciando os serviços ou o próprio servidor. Eu li sobre ferramentas de monitoramento como nagios, munin, cactos etc. para monitorar a saúde do seu servidor / infraestrutura, mas eu realmente não tentei um em produção. Lido com o Drupal quase 99% das vezes e gostaria de descobrir sugestões para o monitoramento no nível do servidor e o monitoramento no nível do Drupal (código do aplicativo).
Basicamente, eu gostaria de ser notificado quando a carga do servidor estiver alta, possivelmente sendo apontada para o culpado (ou a vítima), para que eu possa tomar decisões informadas. Também gostaria de saber o que as pessoas usam para o monitoramento de nível do Drupal (como email) quando houver um erro / aviso do PHP. (O que acontece quando o próprio servidor de email está inoperante?)
fonte
Independentemente de qual você usar, a única coisa que eu definitivamente sugeriria é que, a menos que você tenha uma equipe de TI em tempo integral, não mantenha seu próprio monitoramento: conte com um serviço completamente independente de seus servidores. Uma coisa é ter um servidor voltado para o público inoperante, outra é desativá-lo e não saber porque o servidor de monitoramento também está inoperante. A maioria dos serviços de monitoramento inclui todos os requisitos listados por você imediatamente.
Mas, com o risco de isso se transformar em uma pergunta de recomendação de compras, o serviço que eu uso para os requisitos listados é o Pingdom :
fonte
Estas são algumas sugestões agnósticas de Drupal:
Quanto ao próprio aplicativo Drupal, sugiro usar o Xdebug + Webgrind ou o XHProf para criar um perfil do código e ficar de olho nessa pergunta: Melhor maneira de avaliar o desempenho da pilha do Drupal
fonte
Gosto de pingdom para sites pequenos / médios porque é útil: informa que algo está errado do ponto de vista do cliente, que é acionável. Coisas como média de carga realmente não significam nada, a menos que você tenha uma pilha mal configurada (o que não deveria) ou esteja sendo martelada pelo Digg / Reddit (nesse caso, não há nada que você possa fazer de qualquer maneira, você deve ter preparado).
Do blog de Ted Dziuba:
Leia o post do blog, é hilário.
fonte
Estou usando o check_drupal para monitorar vários sites do drupal. Este é um plug-in do nagios que não requer nenhuma alteração no código do site drupal. O único requisito é que o drush precise estar presente no servidor.
fonte