Eu tenho servidores que ainda estão funcionando bem, mas têm mais de 5 anos. Eles ainda estão fazendo o trabalho perfeitamente e não haverá vantagem em atualizar os servidores; devo deixá-los rodar para sempre ou devo agendar manutenção para substituir os servidores, ou partes deles, por novo hardware? Receio que uma falha no servidor possa custar perda de dados e mais tempo de inatividade do que a manutenção programada. Esses servidores são usados para informações on-line de pontos de venda, contabilidade, CRM e gerenciamento.
Manutenção preventiva, como substituir ventiladores e aspirar poeira, não é possível devido à localização remota dos servidores.
Lembre-se também da "curva da banheira" da taxa de falhas com o tempo. É mais provável que o novo hardware falhe do que o hardware que foi gravado por um tempo.
Como você diz a um cliente que está muito satisfeito com um servidor sem problemas há muito tempo que ele agora precisa gastar dinheiro para substituí-lo por ser muito antigo?
Finalmente, existem ferramentas de monitoramento para problemas de hardware, como tensão, temperatura e velocidade do ventilador, que podem ser executadas remotamente?
fonte
Provavelmente - mas com cautela e atenção aos detalhes.
Coisas para manter em mente:
fonte
Explique ao fornecedor em termos que ele ou ela provavelmente entenderá. Explique que os servidores foram projetados para uma vida útil de 4-5 anos em média. Embora alguns funcionem mais que isso (mantivemos um servidor mancando por 7 anos antes ... não nos orgulhamos dele, mas isso foi nos dias anteriores à virtualização), à medida que você se aproxima e supera essa idade, o servidor será mais propenso a quebrar.
Coloque em termos de carro. Depois de um certo ponto, partes do carro quebram ou se desgastam, como as quebras, e precisam ser substituídas. No entanto, ao contrário de um carro, você não pode simplesmente correr para o local de reparo local e consertar o servidor. As peças de reposição para o fim da vida útil do fornecedor, o que significa que elas simplesmente não estão disponíveis, exceto por alguém que as acumulou e sabe que agora você deve pagar um prêmio por elas. E enquanto você estiver pesquisando essas peças e discutindo sobre a compra, o servidor permanecerá inativo.
Além disso, a maioria das pessoas procura substituir seus carros assim que seu empréstimo é pago. Dado que é mais fácil reparar e manter o carro do que esses servidores, especialmente devido à sua localização remota, apontam que o cliente está arriscando com sua linha de negócios que ele não levaria na vida pessoal.
fonte
Pessoalmente, fico feliz em executar hardware antigo, mas somente quando os riscos foram considerados adequadamente . Como exemplo, eu tenho um servidor IBM bastante antigo que está fora da garantia e não posso mais obter as peças para ele. No entanto, o software executado nele pode ser transferido para outra máquina em questão de minutos. Se a máquina falhar, posso substituí-la temporariamente por um PC sobressalente enquanto decido a melhor solução a longo prazo. Todas as etapas necessárias para isso são bem documentadas; portanto, mesmo que eu esteja indisponível, a tarefa poderá ser concluída por outra pessoa.
fonte
Se os servidores forem adequados, deixe o suporte do fornecedor ser o fator decisivo. Se o fornecedor não oferecer suporte ao sistema, deixe seus clientes decidirem com base em suas preferências.
Se você é o fornecedor, bem, em algum momento você provavelmente precisará eliminá-los.
fonte
Se você decidir executar servidores no local, mais cedo ou mais tarde eles serão executados no local. É melhor substituí-los antes desse horário, ou seja, quando eles ainda parecem estar funcionando bem.
5 anos é uma entrada muito boa para um servidor, e você parece estar chegando a um ponto de cruzamento em que acha que eles ainda podem estar OK por mais um tempo, mas você está tendo preocupações suficientes que justificariam uma substituição.
O pior cenário é que um servidor entra em colapso no meio de um dia útil. Pelo que parece, acho que você não estará em condições de fazer uma migração de emergência e restaurar em um bom período, se isso acontecer. Seu cliente deve ponderar o custo de negócios perdidos (incluindo salários para a equipe que está sentada sem fazer nada) versus o custo de reposição, e acho que a substituição sairá mais barata.
fonte
Se o hardware e o software ainda são bem suportados e compreendidos, parece tolice mudar sem motivo. Os servidores estão localizados em um ambiente limpo e com controle climático? Eles devem continuar correndo por um tempo ainda.
Qual nível de redundância esses servidores antigos fornecem? Eles possuem fontes de alimentação redundantes e armazenamento protegido por RAID com um backup offline testado? Na minha experiência, PSUs e unidades são as partes com maior probabilidade de serem afetadas pela idade. Enquanto você estiver bem protegido, você não deve observar nenhum tipo de tempo de inatividade catastrófico.
Evitar a manutenção preventiva porque os servidores estão fora do seu caminho parece um plano ruim. Se você puder acessar os servidores para substituí-los ou se houver uma falha catastrófica, poderá encontrá-los para manutenção e inspeção.
Só não deixe que eles fiquem tão velhos que ninguém saiba como eles funcionam ou onde conseguir peças para eles.
fonte
Sempre decidimos quando substituir a máquina com base no que ela faz e em quão crítica seria sua falha. Nossa maior parte de máquinas está na verdade migrando para um cluster de virtualização para oferecer uma maneira mais fácil de lidar com falhas.
Para interromper a perda de dados, execute backups. Muitos deles. Máquinas de qualquer idade falham e se você está preocupado com a perda de dados, não está fazendo backups suficientes.
Na prática, porém, eu tenho pelo menos uma máquina crítica em execução com pelo menos 5 anos de idade. Não sei quantos anos tinha quando a empresa foi comprada antes do meu tempo. Não deve ser substituído tão cedo :(
fonte
Eu também incluiria o seguinte - o hardware mais novo é muito mais poderoso que o hardware mais antigo. Você pode consolidar vários servidores em um usando a virtualização. A virtualização, quando feita corretamente, pode facilitar os backups, diminuir significativamente os custos e facilitar a recuperação de desastres. Os servidores mais novos também têm mais suporte para acesso / monitoramento / reparo remoto, como a tecnologia Intel Vpro, que permite acesso, mesmo que o sistema operacional ainda não tenha sido inicializado.
Há também os problemas de familiarização / padronização / saneamento / atualização. Após 5 anos - realmente - quem está familiarizado com o hardware e a configuração? A configuração e todas as coisas, como scripts de login, configurações de segurança ... estão dentro dos seus padrões atuais? Você executou o saneamento, como remover contas de usuários antigos, limpar soluções alternativas antigas? Os componentes ainda estão disponíveis? Eu tenho vários servidores nos sites dos clientes que me preocupam, pois sei que se eles falharem, as placas-mãe / psu e outras partes definitivamente não estarão disponíveis.
fonte