Nosso prédio está localizado aprox. 100 metros das cargas explosivas. Eles acontecem várias vezes por dia e realmente agitam muito o edifício inteiro. Isso vai durar muitos dias e as explosões devem ficar mais fortes.
Nossas salas de servidores não são nada sofisticadas; um deles tem todos os racks em concreto duro, enquanto o outro tem um piso elevado (aquele que permite que os cabos passem por baixo).
Alguém tem alguma dica, contramedidas ou práticas recomendadas para nós?
Atualmente, estamos pensando nas seguintes contramedidas:
- Relatório diário das luzes de status das salas do servidor (luzes HD, fontes de alimentação etc.).
- Verificar todas as noites a verificação de disco nos servidores mais importantes
- Encomende um fornecimento extra de discos rígidos sobressalentes
Edit: Muitas boas respostas aqui! No entanto, é preciso ser aceito. A resposta mais votada no momento desta edição será aceita.
disaster-recovery
server-room
Chris Dale
fonte
fonte
Respostas:
Se eu fosse você, telefonaria para a companhia de seguros da empresa e pediria que acelerassem.
Dessa forma - a companhia de seguros saberá que não é você quem sacode os discos, e a companhia de seguros saberá com certeza quando todas as explosões ocorreram, caso sua SAN morra no exato momento.
(Fizemos isso.)
fonte
Agora seria a hora de verificar sua solução de backup. Todo o hardware de substituição no mundo não o salvará se seus backups estiverem corrompidos ou tiverem sido inúteis.
fonte
Além de todas as outras sugestões excelentes (principalmente backups externos ), você deve considerar a possibilidade de proteger a sua sala contra poeira, na medida do possível: clima em torno das portas, fita nas janelas, etc.
Se você tiver entradas de ar externas planejando alterar o filtra quando a detonação termina.
Tudo isso dito, eu não desperdiçaria tempo / recursos em verificações noturnas de disco ou dinheiro em discos rígidos sobressalentes (talvez compre um ou dois para as máquinas mais críticas, mas lembre-se de que você pode usar unidades noturnas, se necessário).
O equipamento para servidor é surpreendentemente robusto e continuará a operar por anos sob algumas condições bastante terríveis. Provavelmente, você ficará bem.
fonte
Monte seus racks de servidor em plataformas ISO-Base . Isso isolará o rack do servidor dos choques no solo e permitirá que seus sistemas funcionem mesmo em caso de movimento.
Não é fácil, mas é eficaz. Especialmente em zonas de terremotos.
Para ver a ISO-Base em ação, confira este vídeo mostrando os efeitos em um rack de servidor durante uma simulação de terremoto . Um rack é montado em uma base ISO, o segundo rack não.
fonte
Energia: se você perder energia, todos os servidores, armazenamento, saneamento (etc) do seu rack serão reinicializados por conta própria? Ou eles aparecerão somente depois que você pressionar o botão 'Ligar'?
Isso por dois motivos:
Você também pode sugerir aos usuários que desliguem e desconectem os computadores todas as noites.
fonte
A maioria das pessoas fala sobre backup - poucas falam sobre a restauração. Verifique se a restauração do backup é o mais fácil possível. Em particular, se o tempo é crítico.
Se você tiver uma replicação de co-localização, mude para quem é o mestre (se o tempo permitir), pois os do seu prédio são muito mais vulneráveis. Eles também são mais propensos a cair durante o horário de trabalho (evidentemente).
Eu também aconselho trabalhar em casa.
fonte
Toque heavy metal para substituir o hard rock à medida que explode. O hard rock é tão ultrapassado de qualquer maneira. ;)
Mais a sério, talvez haja uma loja de equipamentos de DJ ao virar da esquina, onde você pode pegar algumas coisas de absorção de choque / isolamento. Muitos DJs (dance music) passam por dificuldades semelhantes quando estão tocando discos (ou seja, mantendo uma agulha minúscula em um sulco giratório, algo comparável a equipamentos sensíveis, como unidades de disco) em volume extremo, enquanto as multidões ao redor estão pulando e carimbando no chão em sincronia (o "em sincronia" é importante; se você nunca ouviu falar do incidente de Tacoma Narrows Bridge , considere assistir a este clipe ). Abra alguns sacos de lixo para oferecer proteção adicional contra poeira.
fonte
Estou surpreso que ninguém tenha mencionado o lado do processo.
Esta é a oportunidade perfeita para revisar o que você planejou para a continuidade dos negócios. Qual é o plano se você precisar mudar de escritório por um dia ou uma semana? Você tem planos atualizados de desenhos e quais sistemas têm prioridade para restauração? A gerência informou que você tem um plano e está ciente de
A aceleração das explosões que causam estragos na sala do servidor é provavelmente a menor das suas preocupações. Seus utilitários podem estar em risco muito maior, a menos que você seja auto-suficiente com energia no local e conectividade robusta (supondo que você não seja autônomo e apenas ofereça suporte à equipe local).
Se houver uma falha na rede de água ou energia ou no acesso à Internet, você pode sobreviver a isso? Você ligou para o seu provedor de Internet para saber se eles estão cientes da explosão e se prepararam para restaurar o serviço por uma rota alternativa, se os seus utilitários forem interrompidos. Você conhecerá suas especificidades melhor do que imaginamos, mas você deve ter uma lista de tudo o que precisa para funcionar e abordar "E se isso desaparecer inesperadamente?" para cada.
Analisar isso em sua cabeça / no papel ajudará você a saber se você tem algum ponto fraco que precisa ser resolvido mais tarde e talvez comunique isso na cadeia se a sua organização não tiver nada escrito. Comece com um resumo executivo de duas páginas - apenas um FYI para que todos saibam o que você está fazendo.
Sim - é bom ter alguns discos rígidos / peças extras à mão, mas eu ficaria mais preocupado com as coisas que não consigo ver ou não controlam diretamente.
O benefício real deste exercício de processo é uma verificação da realidade do seu sistema de monitoramento atual. Depois de planejar alguns cenários básicos, você estará melhor preparado para o inesperado. Ter um breve resumo do que você espera sobreviver e do que você não ajuda será muito útil, não importa por que você sofra uma interrupção, e também ajudará a direcionar seus esforços para melhorar o monitoramento 24/7, em vez de quando a fundação começar a tremer.
fonte
Eu costumava executar computadores em um site de mina que estava sendo recuperado. À medida que a recuperação se aproximava cada vez mais do escritório, a sala de dados tremia quase diariamente no final do dia.
Minhas medidas de contador incluíam mover as prateleiras sobre alguns pés de borracha rígidos projetados para amortecer as vibrações. Eles foram feitos por Manson e eu apenas estimei o peso do meu rack e comprei os pés adequados. Isso pareceu consertar qualquer movimento dentro do rack. A parte difícil foi levantar o rack com delicadeza suficiente para deslizar os pés por baixo.
Além disso, como outros já mencionaram, eu tinha backups que testei e mantive fora do local.
Esses servidores duraram 3 anos, com agitação constante e falhas sem hardware. Os desktops no escritório não foram tão bons quanto 2 deles tiveram falhas catastróficas no disco rígido.
fonte
Ainda não vi isso mencionado sobre backups, mas certifique-se de retirá-los do site! Você também pode fazer um backup das configurações do switch, firewall, etc.
fonte
Pergunte à empresa de engenharia que está detonando. As probabilidades são muito boas: eles têm seus próprios equipamentos no local ou sofreram danos explosivos em uma sala de servidores vizinha no passado.
fonte
Releia as crônicas da BOFH . Isso lhe dará algumas idéias práticas sobre como parar as explosões. Tudo o resto será apenas uma contramedida.
No que diz respeito às contramedidas, todo mundo já mencionou os backups, por isso evitarei repetir esse bom conselho.
Verifique seu raid 5 matrizes diariamente e tenha discos sobressalentes disponíveis agora. Toda essa vibração não pode ser boa para os eixos-árvore, e é incrível a frequência com que as matrizes salvas são perdidas devido a um alarme que ninguém ouve e a uma falha do segundo eixo-árvore.
Talvez eu esteja otimista, mas os engenheiros que fazem a detonação normalmente não têm como alvo os níveis de vibração para "destruir a fundação do vizinho", portanto, eu ficaria mais preocupado com as partes móveis dos computadores, os discos.
fonte
Coloque um pouco de proteção embaixo das estantes, especialmente a que é de concreto duro. Vai (ou provavelmente é) sacudir muito. Se você não puder comprar (especialmente por causa do tempo) comprar um piso resistente a terremotos, coloque um pouco de espuma por baixo, para reduzir o tremor.
fonte