Eu tenho uma instância em execução no Amazon EC2 que me transformei em um servidor da web.
Agora, estou observando o cloudwatch, mas não sei se é a ferramenta correta para o trabalho. Basicamente, quero ser informado quando o servidor estiver inoperante, por qualquer motivo.
Talvez o servidor tenha sido hackeado ou o servidor seja desligado por qualquer motivo, eu quero receber uma notificação sobre isso.
Habilitei o clouwatch e tentei configurar um alerta, mas só vejo coisas como entrada na rede ou uso da CPU, e d metrix. Agora eu não sei se isso vai dar certo.
amazon-ec2
amazon-cloudwatch
Saif Bechan
fonte
fonte
Respostas:
Uma recomendação é monitorar uma métrica que sempre deve ter um valor numérico - como o uso da CPU e acionar um alarme quando o estado da métrica for 'dados insuficientes'. Você pode usar o SNS da Amazon para notificá-lo.
Como alternativa, você pode configurar métricas personalizadas que retornam um estado binário para serviços específicos (httpd, mysql, etc.) e geram um alerta sempre que qualquer uma dessas leituras 0. Essa abordagem oferece a possibilidade de detalhes muito mais refinados - combine-os com dados insuficientes 'para cobrir todos os casos.
Você pode ter mais sucesso usando algo que realmente monitora seu site (por exemplo, Pingdom, UptimeRobot etc.).
fonte
Você pode usar o OpsGenie ( http://www.opsgenie.com ) para enviar um alerta rico para o CloudWatch. Atualmente, o CloudWatch possui um conjunto limitado de mecanismos de alerta, incluindo email e SMS por meio do mecanismo SNS.
Você pode configurar o CloudWatch para ligar para a API de serviços web da OpsGenie, notificar rapidamente as pessoas certas por meio de notificações push para aplicativos para iPhone / Android, SMS, chamadas de voz etc. de acordo com as preferências dos destinatários.
Consulte a seguinte publicação no blog para obter informações detalhadas:
http://www.opsgenie.com/blog/2012/09/04/aws-cloudwatch-alarms-on-your-mobile-with-opsgenie.html
fonte
Você pode criar um alarme no Cloudwatch e definir o alarme para notificá-lo quando entrar no estado "Dados insuficientes". A maioria das métricas já disponíveis são do VM Host, que não tem nenhuma idéia real sobre o que está acontecendo dentro de sua máquina.
No começo, recomendo instalar as ferramentas da Amazon em sua instância e configurar um script para relatar algo (qualquer coisa: uso da CPU, o que seja) e alarme se essa métrica parar de enviar dados (para que a métrica entre no estado de dados insuficientes) )
Este é apenas um mínimo, mas deve ser um bom ponto de partida.
Consulte a seção de scripts de monitoramento do guia do desenvolvedor do Cloudwatch: http://docs.amazonwebservices.com/AmazonCloudWatch/latest/DeveloperGuide/mon-scripts.html
fonte
Você pode usar o Route 53 e suas "verificações de integridade". Com isso, você pode enviar alertas de SNS e também redirecionar seus usuários para outro site secundário ou uma tela de erro. Penso que esta é uma solução melhor para o seu problema do que o Cloudwatch.
fonte
Você pode implementar uma verificação de status do EC2 . É feito no painel do EC2. Vá para instâncias, selecione sua instância, escolha a guia Verificações de status (ao lado da descrição da instância) Clique em criar alarme de verificação de status O padrão "Status Check Failed (any)" deve ser bom. Eu sempre defino o intervalo para mais de um, para não me incomodar por problemas transitórios.
Também é possível configurar o EC2 para recuperar automaticamente sua instância se ela for desativada por algum motivo.
Eu também recomendo um sistema de monitoramento secundário. Burro é bom para este. Eu configurei o utilitário linux mon apontado para o meu servidor web de outro host. Se ele não conseguir obter um código de resposta 200 duas vezes seguidas, recebo um email.
fonte
Se você deseja monitorar pontos de extremidade HTTP, como sua API ou site, confira minha postagem no blog sobre como conseguir isso com as verificações de integridade do Route 53 (mesmo se você não usar o Route 53 para DNS):
http://eladnava.com/monitoring-http-health-email-alerts-aws/
fonte