Aqui está o meu cenário: sou um desenvolvedor que herdou (sem o meu conhecimento) três servidores localizados no meu escritório. Também herdei o trabalho de ser o administrador dos servidores com uma distinta falta de conhecimento em administração de servidores e o google / ServerFault como ponto de referência. Felizmente, nunca tive que entrar em contato físico com as máquinas ou resolver qualquer problema, pois elas sempre 'funcionavam'.
Todas as três máquinas estão localizadas na mesma sala de dados e têm o seguinte objetivo:
Machine1
- IIS 8.0 hospedando vários aplicativos internos
Machine2
- Armazenamento de dados do SQL Server 2008 R2 para aplicativos internos
Machine3
- Armazenamento em espelho do SQL Server 2008 R2 deMachine2
Todos os três têm discos rígidos externos conectados que fazem backups frequentes com freqüência.
Fui informado de que todos os três precisam passar de um data center para outro nas mesmas instalações. Não completarei a movimentação física do hardware, que será tratada por um responsável competente.
Além de fazer um backup completo de cada um, que considerações devo fazer antes de pressionar hipoteticamente o interruptor e ver meu mundo se mover?
Estou ciente de que está longe de ser ideal ter todos os três localizados na mesma sala / local, mas esse já passou do escopo desta pergunta.
Respostas:
Pergunta genuinamente interessante, bem feita :)
Há algumas coisas que você precisa verificar antes dessa mudança, algumas fáceis, outras difíceis.
Energia - verifique se a nova sala possui não apenas a quantidade certa de tomadas, mas também o tipo certo - como no tipo de conector físico e se o local atual permite diferentes fases de energia por servidor para proteger contra falhas de fase única, então eu recomendamos que você replique isso também no novo local.
Resfriamento - você precisa verificar se não haverá um acúmulo imediato ou gradual de calor que levará ao superaquecimento e ao possível desligamento do servidor. Geralmente, você pode procurar a potência máxima (em watts) ou o calor (em BTUs) que cada servidor pode obter no site do fabricante - informe o gerente da obra e receba uma confirmação por escrito informando que o resfriamento naquele local suportará .
A rede - essa é difícil - não apenas o mesmo número de portas precisa ser replicado entre o local antigo e o novo, mas também o tipo, a velocidade e a configuração mais importante. Este último ponto é a chave - houve um tempo em que quase todas as portas de uma rede eram praticamente iguais - tenho idade suficiente para lembrar daqueles tempos! mas hoje em dia o número de configurações de portas e o local na rede em que qualquer porta pode estar é astronômico, você precisa garantir que o pessoal da sua rede replicou TUDO para ser idêntico do antigo para o novo - novamente faça isso por escrito, pois não é fácil. Se algo der errado com essa mudança, eu colocaria dinheiro nas portas de rede que não são idênticas, isso acontece o tempo todo.
'Outras conexões' - você sabe se seus servidores têm outras conexões além de energia e rede? talvez eles tenham links Fibre Channel para armazenamento compartilhado, links KVM para uma tela de gerenciamento compartilhada - novamente, caso seja necessário replicá-los de forma idêntica.
Fora isso, sinta-se à vontade para voltar aqui com perguntas mais específicas e espero que a mudança corra bem.
fonte
Outras respostas cobrem os aspectos técnicos da mudança. Você também pode ter que considerar algumas outras coisas.
Verifique se os usuários sabem que seus aplicativos ficarão inativos durante a mudança. Você desejará agendar a mudança, talvez fora do horário comercial, para minimizar o número de pessoas afetadas.
Peça a uma pessoa experiente (ou pessoas) para testar os aplicativos depois de abrir os servidores. Faça com que eles façam algumas verificações de sanidade para garantir que os aplicativos funcionem conforme o esperado.
Após o teste, informe aos usuários que a mudança foi concluída e peça que eles saibam se eles têm algum problema.
fonte
É muito difícil distinguir e delimitar "muito amplo" para o nosso formato. A coisa mais importante que você precisa verificar é se você precisa reconfigurar sua rede de qualquer maneira, se eles podem continuar funcionando com os mesmos endereços. Mesmo que eles possam manter os mesmos endereços, verifique se eles não estão configurados via DHCP e / ou verifique se o servidor DHCP estará disponível no novo local.
Nota lateral: Como você já declarou, ter o servidor SQL e seu espelho está longe de ser o ideal. No entanto, ter as unidades de backup no mesmo local é realmente perigoso. Você precisa ter seu backup em um local físico diferente.
fonte
Outras respostas têm boas considerações antes da movimentação. No entanto, você também deve planejar como organizar a mudança real. Pelo fato de o Machine3 ser um espelho do Machine2 , parece que o tempo de atividade é uma consideração significativa para os bancos de dados do SQL Server 2008 R2. O fato de ser um espelho oferece uma oportunidade. O motivo da existência de um espelho deve estar disponível quando o servidor principal não estiver. Isso inclui não estar disponível devido à manutenção, o que inclui a movimentação.
Faça um plano:
você deve fazer um plano por escrito de como a mudança será realizada. Pode ser necessário que você forneça esse plano, ou partes dele, para as pessoas que lidam com partes do trabalho (por exemplo, os responsáveis pela mudança). Esse plano deve incluir todas as atividades anteriores à movimentação, a movimentação real e as ações pós-movimentação (por exemplo, verificação da funcionalidade).
Mova o básico:
Descrição mais detalhada da mudança:
A seguir, são apresentados dois métodos (Caminho A e B) do uso da Máquina3 para testar as conexões da Máquina1 e / ou Máquina2 . Você deve usar apenas um método. A maneira de fazer isso, ou mesmo se usar, depende das informações não contidas na pergunta (por exemplo, separação física dos locais finais da máquina, tamanho físico das máquinas, comprimento dos cabos de rede / energia, disponibilidade de extensões para os mesmos, similaridade de configurações de porta de rede, necessidades de tempo de atividade etc.). O uso do Machine3 para testar essas conexões potencialmente permite maior tempo de atividade do Machine2 , mas principalmente do Machine1 , que não possui espelho. Você pode optar por usar um ou outro método.
Mova o Machine3 primeiro.
Caminho A: (opcional):
Mova o Machine2 .
[Caminho B: Não é necessário se você testou todas as conexões com o Machine3 na etapa opcional nº 2] Se agora possui o Machine3 onde o Machine1 deve terminar:
Mova o Machine1 .
fonte
Se algum dos IPs dos servidores for alterado e as conexões forem feitas com a caixa SQL via resolução DNS, será necessário agendar uma alteração nos registros DNS ao mesmo tempo que a movimentação.
Coisas que você deve saber sobre o software e os bancos de dados da intranet:
Se você não obtiver exatamente os mesmos IPs ou se terminar em uma sub-rede diferente, precisará de acesso para alterar o código-fonte ou os arquivos de configuração de todos os aplicativos que se conectam ao servidor SQL. As pessoas podem confiar no acesso SQL não documentado e direto para relatórios ad-hoc.
fonte
Utilize os servidores "Recuperação de desastres". Passe para eles para lidar com a carga enquanto move seus servidores de produção. Com o equipamento de DR configurado corretamente, você pode fazer a mudança no meio do dia sem observar muito tempo de inatividade (até 15 minutos). Como os servidores de recuperação de desastre devem ser configurados da mesma maneira que os servidores de produção. Se você não possui equipamento de recuperação de desastres, recomendo adquiri-los.
Pense da seguinte maneira: enquanto sua corveta está sendo aperfeiçoada, use sua minivan para passar o dia.
fonte
Uma coisa que acho que não foi mencionada é a segurança física da nova casa dos servidores. Para que a sala era usada antes e quem tem as chaves? Existe segurança adequada (sistemas de alarme, câmeras etc.).
fonte
Algumas considerações além das outras respostas:
Os aplicativos estão vinculados a outros por, por exemplo, troca noturna de dados por arquivo ou pelo uso de serviços da web? Quais são as consequências quando os aplicativos não estão disponíveis? Os aplicativos relacionados podem lidar com isso ou eles falham ou até produzem resultados errados devido à falta de informações de seus aplicativos?
Um tempo de inatividade é aceitável para seus usuários, empresa ou mesmo clientes? Quanto tempo pode demorar?
Eu acho que é uma boa idéia ter um plano para uma reversão. Você pode usá-lo no caso de um problema que não pode ser resolvido rapidamente, por exemplo, um problema de rede. Você provavelmente precisará manter o motor disponível para o caso de trazer o hardware de volta.
Seus aplicativos levam a um alto tráfego de rede e a rede precisa estar preparada para isso (provavelmente um problema muito mais improvável do que problemas com endereços e firewalls)? Se você tiver aplicativos em tempo real (por exemplo, software de videoconferência), as latências serão importantes.
Os servidores devem caber no rack do servidor, se você tiver um.
fonte