Dado um servidor interno em execução no modo de produção, eu gostaria de manter o menor impacto possível sobre os usuários ao implantar atualizações regulares (no próprio servidor, não nas máquinas dos usuários ... mas isso seria um problema muito semelhante).
A resposta óbvia à minha pergunta é "à noite, quando os usuários estão em casa". Mas "noite" é um longo período de tempo. Deve-se começar no início da noite para talvez pegar problemas com a atualização logo no início e estar pronto para reverter? Ou é melhor começar de manhã cedo e usar os primeiros usuários como "cobaias" para desencadear os problemas mais rapidamente? Ou no meio da noite, quando a concentração de quem supervisiona a atualização é bastante baixa, mas é garantido que não haja identificadores de arquivos abertos para alguns usuários que estão atrasados?
Existem trabalhos de pesquisa sobre o assunto?
Isso depende inteiramente da natureza do negócio. Alguns escritórios são 9-5, cinco dias por semana. Outras empresas são 24 horas por dia, 365 dias por ano. Outros fatores, como disponibilidade de pessoal e recursos, desempenham um papel significativo. Nenhum trabalho de pesquisa poderia abranger de maneira abrangente todos os horários ou eventualidades possíveis.
Por fim, o gerenciamento da empresa ou departamento em conjunto com o gerenciamento de TI precisa determinar o que é melhor.
A chave do sucesso é a comunicação com os usuários quando o tempo de inatividade está programado para começar, quanto tempo deve durar, qualquer preparação exigida aos usuários e o que eles podem esperar como resultado de sucesso ou falha. Grande parte disso é atender às expectativas que você define.
No final, nada está gravado em pedra. Se o processo não funcionar, faça os ajustes. Sua flexibilidade e adaptabilidade serão apreciadas.
Ao executar os procedimentos de manutenção e atualização dos equipamentos de teste com antecedência, quando possível, você estará melhor preparado na hora de implementá-los nos sistemas de produção.
fonte
Eu trabalho em um provedor de serviços de Internet e, na minha experiência, a maioria das pessoas que consideraria administradores de sistemas pesados lançam as noites de sexta-feira nos fins de semana de férias para realizar suas principais revisões na rede. Isso lhes dá 24 horas extras para testar e, se necessário, reverter suas alterações. No entanto, em grande parte, isso depende inteiramente da natureza e dos hábitos de seus usuários.
fonte
Instalamos as atualizações às 21h, tarde o suficiente para a maioria das pessoas não estar ligado, com antecedência suficiente para agitar a noite toda, se necessário.
fonte
No meu caso, instalamos atualizações às 4h, para evitar impacto em qualquer usuário, mesmo aqueles que estão trabalhando um pouco tarde.
Se você possui um bom sistema de monitoramento que avisa se ocorrer um problema, conserte-o de manhã cedo, antes mesmo de trabalhar.
fonte
Realmente depende da natureza do seu negócio, mas eu pessoalmente prefiro quarta-feira à noite depois das 17h. Você nunca quer fazer isso nas noites de sexta-feira, pois se algo der errado, você estará trabalhando no fim de semana. Ao fazer isso na quarta-feira, você receberá quinta e sexta-feira para corrigir os problemas, se houver.
Outro fator importante é agendar janelas de gerenciamento de alterações. É fundamental que as pessoas saibam que você está executando manutenção - que os serviços podem ser interrompidos ou indisponíveis durante esse período. Isso permitirá que você trabalhe com confiança, em vez de se preocupar com o fato de os usuários reclamarem da inatividade dos serviços. Sua gerência precisa aprovar as janelas de mudança, é claro.
fonte