O gerenciamento de propriedades da minha organização me informou que nosso prédio perderá energia por 4 horas amanhã. Preciso estar preparado para este evento (somos uma organização pequena, sou jovem, portanto sou de TI). De que tipo de coisas eu preciso estar ciente.
Estou pensando em entrar e desligar todas as máquinas e impressoras. Isso vai me cobrir? Temos um switch gerenciado. Precisa ser desligado? Preciso desconectar os plugues em caso de aumento?
Parece que estarei coberto por toda parte se eu desconectar tudo. Obrigado por qualquer insight embora.
Tendo acabado de terminar um desligamento do datacenter na última semana, isso está fresco em minha mente;). Sim, desligar tudo precisa ser feito. Algumas coisas podem tolerar que a energia seja arrancada por baixo delas e geralmente podem ser identificadas por não haver um interruptor de energia nelas. Dependendo do que diabos as instalações estão fazendo, você pode desconectar fisicamente os ativos de maior valor da parede.
Às vezes, você pode obter picos de energia consideráveis quando a energia retornar, e isso pode matar a marcha. Além disso, esteja ciente de sua carga de inicialização. TUDO ligar ao mesmo tempo pode ser suficiente para estourar os disjuntores e derrubar tudo novamente. Isso é péssimo. Tente uma inicialização faseada para contornar isso.
EDIT: Tivemos um caso em que a chave de transferência do gerador não disparou e o no-break ficou sem bateria. Quando o utilitário voltou, tudo foi ligado de uma só vez. 20 segundos depois, o no-break bateu em Sobrecarga e soltou a carga da sala novamente. Naquele momento, técnicos suficientes haviam chegado ao local (tinha acontecido durante um fim de semana) para conseguir desligar coisas suficientes nos interruptores de rack que, quando a concessionária voltava, a sala não caía novamente . Aquele ioiô nos custou muito hardware e estava se recuperando semana de alguns dos danos.
fonte
A única coisa que eu acrescentaria é garantir que todos os seus contratos de suporte e peças de reposição sejam facilmente encontrados. Tenho certeza que sim, mas verifique isso duas vezes e três vezes. Se você possui servidores que não são desligados há muito tempo, ocasionalmente encontrará problemas com todas as partes móveis (rolamentos / motores de disco rígido, motores e ventiladores de disco rígido e algumas coisas realmente tolas que normalmente não pensamos sobre).
Se você puder ficar lá durante o período, faça uma lista dos servidores importantes, incluindo a etiqueta de serviço, configurações, onde estão os backups e qualquer pessoa que possa ser responsável pelos aplicativos em cada máquina. Coloque fita adesiva na lateral do servidor em questão ou coloque-a em um fichário no datacenter para quando você começar a tentar recuperar as coisas. Você não quer continuar correndo por todo o escritório se algo estiver quebrado.
fonte
Primeiro de tudo, você tem bons backups, certo? :) Sempre é uma boa ideia garantir o backup, caso o disco decida não girar, etc., quando você colocar tudo online novamente. Nada como respirar com facilidade após uma queda de energia e depois perceber que um servidor SQL crítico nunca voltou. :)
Segundo, você está certo, desligue e desligue todos os servidores com facilidade, etc.
Se não é um edifício moderno e / ou você não possui um UPS alinhado com proteção contra sobretensão (o que parece) ou algo assim, é sempre melhor prevenir do que remediar, e eu sugiro que desconecte o equipamento. Colocar a energia on-line novamente pode resultar em um aumento de energia.
Além disso, um pouco de FYI; derrube seus servidores principais por último (como DNS, etc.) Você não deseja derrubar seus servidores DNS e não conseguirá resolver o restante dos servidores se estiver desligando-os remotamente :)
Ao colocar tudo de volta on-line, coloque o equipamento de rede primeiro, depois os servidores críticos principais e, finalmente, os servidores de aplicativos / arquivos.
Boa sorte!
fonte
Desligue tudo, incluindo comutadores e roteadores, e desconecte ou desligue a tomada da parede.
Se você está preocupado com picos de tensão, existe um orçamento para adquirir alguns no-breaks pequenos para cobrir os equipamentos mais críticos?
EDIT: Gosto da sugestão de neobyte de ter um "plano de teste" para quando você devolver as coisas. Mesmo se você tiver apenas um em sua cabeça, e um pedido firme a seguir para restaurar serviços rapidamente, você ficará bem. Certifique-se de que as pessoas saibam que você está trabalhando de acordo com um plano e espero que elas entendam por que ligar a estação de trabalho antes de olhar para os servidores e mudar não vai ajudar!
fonte
Dependências entre servidores / ordem de inicialização do servidor também serão melhor definidas com antecedência. Por exemplo, se for uma rede Windows, ligue primeiro o DC, depois os servidores de banco de dados, depois troque etc. Essa é uma ótima lista para sua documentação, em qualquer caso.
Minimiza reinicializações e spam de arquivos de log.
fonte
Tarde demais para um cenário de desligamento ensaiado. Sugiro que você faça tudo o que descreveu e fique por perto quando a energia voltar.
não esqueça de postar uma nota explicando aos seus colegas o que aconteceu. a maioria deles terá "esquecido" de desligar o computador e talvez queira saber por que o sistema precisa ser inicializado ...
fonte