Qual é o melhor momento para agendar atualizações regulares no servidor de produção interno?

9

Dado um servidor interno em execução no modo de produção, eu gostaria de manter o menor impacto possível sobre os usuários ao implantar atualizações regulares (no próprio servidor, não nas máquinas dos usuários ... mas isso seria um problema muito semelhante).

A resposta óbvia à minha pergunta é "à noite, quando os usuários estão em casa". Mas "noite" é um longo período de tempo. Deve-se começar no início da noite para talvez pegar problemas com a atualização logo no início e estar pronto para reverter? Ou é melhor começar de manhã cedo e usar os primeiros usuários como "cobaias" para desencadear os problemas mais rapidamente? Ou no meio da noite, quando a concentração de quem supervisiona a atualização é bastante baixa, mas é garantido que não haja identificadores de arquivos abertos para alguns usuários que estão atrasados?

Existem trabalhos de pesquisa sobre o assunto?

akira
fonte

Respostas:

5

Por que não examinar historicamente o uso simultâneo do seu sistema e determinar quais horários do dia são mais baixos? Em seguida, faça a alteração no meio desse período de baixo uso.

Ao calcular quanto tempo a mudança levará, inclua testes de implementação pré / pós e testes de verificação de produção. Além disso, calcule quanto tempo a alteração levará para reverter se algum teste falhar.

IMHO seus 'primeiros usuários' não devem ser cobaias. Ter usuários ativos basicamente na verificação de produção testando suas alterações não é uma coisa boa. Isso destrói a confiança do usuário final e os resultados inesperados podem atrapalhar a produção, o que significa não apenas que você deve reverter a alteração, mas também reverter qualquer 'dano' que a alteração possa ter causado.

Não conheço nenhum trabalho de pesquisa, mas dê uma olhada em qualquer estrutura de gerenciamento de serviços de TI (ITSM), como a ITIL, você encontrará muitos padrões e práticas recomendadas em gerenciamento de liberação de software. Todos os sistemas são diferentes, portanto, a extensão de quantas práticas você adota e a formalidade depende. Os padrões ITSM têm grandes sistemas em mente.

Nick Kavadias
fonte
os padrões e as melhores práticas não caem do nada, é por isso que eu estava interessado na pesquisa "original". mas obrigada mesmo assim.
akira
Sim, percebo que os padrões não se materializam do nada; declarando minha ignorância em trabalhos de pesquisa na área.
Nick Kavadias
5

Isso depende inteiramente da natureza do negócio. Alguns escritórios são 9-5, cinco dias por semana. Outras empresas são 24 horas por dia, 365 dias por ano. Outros fatores, como disponibilidade de pessoal e recursos, desempenham um papel significativo. Nenhum trabalho de pesquisa poderia abranger de maneira abrangente todos os horários ou eventualidades possíveis.

Por fim, o gerenciamento da empresa ou departamento em conjunto com o gerenciamento de TI precisa determinar o que é melhor.

A chave do sucesso é a comunicação com os usuários quando o tempo de inatividade está programado para começar, quanto tempo deve durar, qualquer preparação exigida aos usuários e o que eles podem esperar como resultado de sucesso ou falha. Grande parte disso é atender às expectativas que você define.

No final, nada está gravado em pedra. Se o processo não funcionar, faça os ajustes. Sua flexibilidade e adaptabilidade serão apreciadas.

Ao executar os procedimentos de manutenção e atualização dos equipamentos de teste com antecedência, quando possível, você estará melhor preparado na hora de implementá-los nos sistemas de produção.

Pausado até novo aviso.
fonte
williamson: research: pode-se medir quanto dos administradores gerais fazem suas atualizações a que horas do dia e se eles experimentam mais erros de manhã ou à noite. mesmo que um determinado administrador tenha que agir da maneira que ele faz em um determinado momento para corresponder às circunstâncias da empresa: se a pesquisa mostrar que ele está no fuso horário "erro", talvez ele possa mudar um pouco as coisas. Eu estava curioso sobre quando as pessoas realmente fazer suas atualizações, as 2 primeiras respostas escolheu a 'noite' exatamente e 'manhã' :)
akira
1
Comece no início da sua janela de interrupção negociada. Isso lhe dá mais tempo para consertar algo que dá errado.
mfinni
para ser justo, é o tipo de 'senso comum' que geralmente esquecemos de mencionar.
mfinni
3

Eu trabalho em um provedor de serviços de Internet e, na minha experiência, a maioria das pessoas que consideraria administradores de sistemas pesados ​​lançam as noites de sexta-feira nos fins de semana de férias para realizar suas principais revisões na rede. Isso lhes dá 24 horas extras para testar e, se necessário, reverter suas alterações. No entanto, em grande parte, isso depende inteiramente da natureza e dos hábitos de seus usuários.

Lloyd Baker
fonte
1
Fizemos o mesmo quando eu trabalhava em uma universidade - as férias também significavam menos probabilidade de as pessoas estarem por perto, mas dependendo do tipo de negócio, isso poderia ter um efeito oposto.
Joe H.
sim, mas aqui pretendo atualizações "diárias". se a janela inativa é de 48 horas .. então é realmente a escolha óbvia.
akira
@akira: ninguém no seu perfeito juízo faz atualizações diárias
Zypher
2

Instalamos as atualizações às 21h, tarde o suficiente para a maioria das pessoas não estar ligado, com antecedência suficiente para agitar a noite toda, se necessário.

Chris S
fonte
2

No meu caso, instalamos atualizações às 4h, para evitar impacto em qualquer usuário, mesmo aqueles que estão trabalhando um pouco tarde.

Se você possui um bom sistema de monitoramento que avisa se ocorrer um problema, conserte-o de manhã cedo, antes mesmo de trabalhar.

Florent Courtay
fonte
1

Realmente depende da natureza do seu negócio, mas eu pessoalmente prefiro quarta-feira à noite depois das 17h. Você nunca quer fazer isso nas noites de sexta-feira, pois se algo der errado, você estará trabalhando no fim de semana. Ao fazer isso na quarta-feira, você receberá quinta e sexta-feira para corrigir os problemas, se houver.

Outro fator importante é agendar janelas de gerenciamento de alterações. É fundamental que as pessoas saibam que você está executando manutenção - que os serviços podem ser interrompidos ou indisponíveis durante esse período. Isso permitirá que você trabalhe com confiança, em vez de se preocupar com o fato de os usuários reclamarem da inatividade dos serviços. Sua gerência precisa aprovar as janelas de mudança, é claro.

Marseille07
fonte