Com que freqüência os servidores Windows precisam ser reiniciados?

77

Um pouco de histórico: Temos vários servidores Windows (2003, 2008) para o nosso departamento. Como somos uma divisão de TI, gerenciamos nossos próprios servidores. Entre nós quatro, sou o único com uma pequena quantidade de conhecimento em TI. (Observe a "pequena quantidade".) Meu chefe diz que os servidores precisam ser reiniciados pelo menos semanalmente. Discordo. Nosso departamento de TI diz que, porque ela os reinicia constantemente, é por isso que nossos discos rígidos falham e as fontes de alimentação acabam com eles. (Isso aconteceu com alguns de nossos servidores algumas vezes nos últimos quatro anos e muito recentemente.)

Portanto, a pergunta é: com que frequência todos reiniciam seus servidores Windows? Existe um padrão ou recomendação do setor? Nosso departamento de TI está correto ao dizer isso porque reiniciamos é por isso que estamos tendo problemas de hardware? (Preciso de um motivo para mudar de ideia!)

Evan
fonte
111
Ah, a cada segunda terça-feira do mês . :)
jscott
4
Dang! Estávamos fazendo toda quarta quinta-feira do mês! :)
Evan
2
Estou no barco oposto. Não é permitido reiniciar servidores sem um debate de uma semana para o outro, que dura cerca de 12 horas por servidor. Sim, isso inclui reinicializações para aplicação de patches, o que efetivamente significa que nunca é feito.
Hyppy
19
Reiniciar semanalmente também não deve causar um aumento drástico nas falhas de hardware.
26411 JamesRyan
3
Parece que seus servidores são reinicializados com mais frequência do que meu laptop. Geralmente, entro no modo de suspensão quando não estou usando. O motivo usual para fazer uma reinicialização é instalar atualizações ou software do Windows.
26511 Phil

Respostas:

116

Meu chefe diz que os servidores precisam ser reiniciados pelo menos semanalmente

Eu discordo totalmente . A Microsoft fez grandes progressos desde os bons dias [NT, alguém?] Em relação à estabilidade e ao tempo de atividade. É uma pena que o consenso no suporte de TI não tenha mudado junto com isso.

Com que frequência todos reiniciam seus servidores Windows?

Somente quando necessário - devido a uma atualização do SO / software, uma falha crítica do software que não pode ser recuperada por outros métodos, atualização / substituição de hardware ou outra atividade que não pode ocorrer sem uma reinicialização. 1 1

Existe um padrão ou recomendação do setor?

Eu nunca vi uma recomendação padrão, per se , mas eu poderia não concordar com qualquer recomendação [exceto do MS-se] o que indicaria uma reinicialização necessária em um intervalo de tempo específico "just-porque".

Nosso departamento de TI está correto ao dizer isso porque reiniciamos é por isso que estamos tendo problemas de hardware?

Reiniciar [e, mais ainda, pedalar] é o período mais estressante de atividade de hardware para um computador. Você tem quase tudo girando até 100% - discos e ventiladores ... ... bem como flutuações significativas nas temperaturas dos componentes. O hardware moderno é incrivelmente resiliente, mas isso não deve ser um motivo apenas para devolver servidores, por capricho, algumas vezes por semana.

1 Além disso, detesto quando os técnicos "apenas" reiniciam um servidor Windows no caso de um serviço com falha ou algo parecido. Entendo a necessidade de executar o serviço novamente, mas uma reinicialização deve ser a última etapa na resolução de problemas em um servidor. Identificar e corrigir [!], A causa raiz da falha quase nunca deve resultar em "Meh, basta reiniciá-la ...."

jscott
fonte
2
Obrigado pela resposta completa. Fazemos atualizações uma vez por mês, o que, obviamente, quando fazemos aqueles que precisamos reiniciar. Agradeço a resposta.
Evan
5
Eu tenho que discordar do seu adendo. Se o serviço definir o servidor (por exemplo, um servidor NFS que interrompa o compartilhamento de exportações), e você souber que uma reinicialização limpa fará o serviço voltar em X minutos, e após a solução básica de problemas, você determinará que será necessário x + 5 para resolver o problema. É mais conveniente apenas reiniciar. Você pode fazer uma análise de causa posteriormente. Agora, esse é o meu método de fazê-lo de qualquer maneira, e você pode argumentar a favor e contra com bastante facilidade :) Exatamente como eu jogo.
Mateus
34
@ Matthew: Executar a análise de causa raiz após o fato é bom se não houver informações transitórias sobre a causa perdida pela reinicialização. Acho que falo para várias pessoas quando digo que prefiro ter mais um tempo de inatividade prolongado para resolver e corrigir a causa raiz de uma interrupção do que vários incidentes de tempo de inatividade mais curtos quando eu decidir "apenas reiniciar" e potencialmente perder a capacidade de usar informações voláteis para ajudar na análise da causa raiz.
Evan Anderson
8
@ Matthew Em casos de falha de serviço, eu esperaria que o técnico tentasse reiniciar o serviço , como uma etapa de solução de problemas, antes de reiniciar a caixa inteira.
Jscott #
6
@Evan Concordo com você, no entanto, acho que deve haver um limiar de incidentes que se tornam um problema. Por exemplo, se acontecer uma vez por mês e for resolvido em 10 minutos com uma reinicialização, a empresa pode nunca se importar com a causa raiz. Acho que você e eu gostaríamos de saber, mas o tempo de atividade é mais importante do que a causa raiz. No entanto, se isso acontece três vezes por semana, é uma história totalmente diferente.
Jim B
52

Os servidores Windows precisam ser reinicializados mensalmente, se você estiver aplicando patches. Você está aplicando patches, certo? Direito?

Hyppy
fonte
8
1 por me fazer
3
Você aplica patches apenas mensalmente?
John Gardeniers
Estritamente falando, o xe está aplicando apenas os patches que requerem reinicialização mensal. Nem todos os PTFs exigem uma reinicialização e nem todas as atualizações mensais contêm essas correções.
JdeBP
2
Eu reinicio apenas os servidores Windows quando uma atualização exige . Às vezes, demora alguns meses sem um patch que exija reinicialização. No entanto, tenho servidores Linux que não são reinicializados há anos e funcionam sem problemas. Eu acho que o mais longo que eu vi na minha rede é uma caixa Linux que foi colocada em um armário e esquecida (ela recebeu atualizações automáticas). Eu participei e o tempo de atividade foi de 3 anos. Um ano depois, foi reiniciado devido à falha na fonte de alimentação.
James
Se fosse linux ou BSD, você poderia corrigir seu servidor sem precisar de uma reinicialização. Você só deve reiniciar para atualizações do kernel (e com uma distribuição orientada ao servidor, essas não são frequentes).
SnakeDoc
18

Vou dar uma resposta alternativa para um caso muito específico. Os avanços dos últimos 2 a 3 anos podem ter mudado isso, mas se você tiver servidores TS ou Citrix muito usados ​​que executam muitos aplicativos interativos (como o Office), é uma boa ideia fazer reinicializações semanais fora do horário de trabalho, apenas para iniciar a partir de uma lista limpa de recursos, como sessões presas, pilha de área de trabalho usada, etc. Se você tiver seu farm configurado corretamente e escalonar as reinicializações, mesmo se você tiver pouco uso fora do horário de expediente, os usuários não devem ser afetados.

Claro, são reinicializações regulares de servidores, mas eles estão sendo usados ​​como desktops.

mfinni
fonte
4
Mm ... boa ligação para o caso TS / Citrix.
Hyppy
Experiência semelhante aqui usando o Citrix com o software de gerenciamento de auditoria da CCH.
1
O mesmo se aplicava nos dias do MetaFrame, quando a própria Citrix recomendava reinicializações noturnas, se isso fosse prático.
John Gardeniers 27/05
Sim, Metaframe ... de quem. Não sinto falta de brincar com o arquivo de mapeamento do driver da impressora. Certamente ficou muito melhor do ponto de vista de gerenciamento de TI.
Mfinni 27/05
10

Esta é mais uma questão política e psicológica do que técnica.

Na minha experiência, certas pessoas que trabalharam com algumas das versões mais antigas do Windows pensaram que precisavam de reinicializações semanais e consagraram essa filosofia em um pequeno canto da mente (elas nunca parecem perceber quando um a reinicialização é perdida quando estão de férias). A menos que você tenha alguns sistemas e aplicativos muito instáveis, ele não é mais baseado na realidade.

Por outro lado, reinicializações freqüentes podem catalisar falhas de hardware, mas não é provável que seja a causa disso.

Shane Madden
fonte
7
Meu chefe é um bom amigo do administrador de rede aposentado que lhe disse que precisava ser reiniciado pelo menos semanalmente ... o que explica por que ela é tão inflexível quanto a isso. Obrigado pela resposta.
Evan
5
Não é à toa que ele está "aposentado" ... isso é um eufemismo para demitido?
KCotreau
3

O único momento em que eles precisam ser reiniciados é para manutenção, se tudo estiver funcionando corretamente . Reinicializações agendadas são realmente apenas um requisito quando A) atualiza o software, B) realiza manutenção de hardware ou C) lida com um vazamento de memória que não pode ser resolvido reiniciando o software / serviço que o causa. Embora o Windows não seja conhecido por muito tempo de atividade, isso acontece (o último trabalho teve algumas caixas Win2k que estavam funcionando há meses - elas apenas funcionavam). Lembre-se de que qualquer patch provavelmente precisará de reinicializações.

Mateus
fonte
Obrigado pela resposta. Isso deve ajudar a convencê-la.
Evan
1
Encontrei caixas do Windows NT, 2000 e 2003 na rede de trabalho que estão em funcionamento há vários anos. e até recentemente, nosso data center tinha uma política anual de correções e, com mais de 600 servidores, não é incomum ver tempos de atividade acima de 250 dias. Meus servidores (eu tenho cerca de 120) São atualizados e inicializados quando todos os patches da Microsoft. Às vezes, como no mês passado, não tínhamos ciclo. O tempo de atividade depende do que está sendo executado no servidor e de como as coisas funcionam juntas. 2003 R2 com essas coisas que tenho que executar precisa ser reinicializado a cada 35 dias. coisas engraçadas acontecem depois disso.
Christopher Thornton
2

Eu não sou um especialista no assunto, mas dependendo de quais serviços você está executando, alguns podem estar sujeitos a transbordar em determinadas funções de tempo, como timeGetTime () e getTickCount ().

timeGetTime tem um resultado de 32 bits, que é igual ao número de milissegundos desde que o computador foi iniciado. O tempo máximo é de aproximadamente 49,7 dias.

Mateus
fonte
2
Err, não. Eu tenho um servidor (em uma rede confiável e completamente isolada - não pregue para mim) que está funcionando há quase 14 meses sem efeitos negativos.
Ben Pilbrow 26/05
3
Não pretendia sugerir que todos os servidores e instâncias teriam esse problema, mas que se o servidor usasse um software que utilizasse essas funções e não as considerasse, haveria problemas computacionais.
Mateus
2
O problema do timer de 32 bits é válido, mas é um problema que os fornecedores de software individuais precisam evitar cuidadosamente em seu próprio código. O Windows não é mais suscetível a falhas relacionadas a esse cronômetro (como no passado), mas se você tiver um software instalado que não seja responsável pela reversão do cronômetro, poderá causar efeitos imprevistos.
tylerl
1
Você está se referindo a este Microsoft KB ?
Jscott # 26/9
9
Err, este é um erro do NT 4, que ganha 2k + não sofre com isso. Acho que podemos dizer com segurança que o NT 4 está morto em 2011. e se alguém o estiver executando em algum lugar ... eles merecem o que recebem nesse momento.
Zypher 26/05
2

Eu costumava reiniciar todos os meus servidores Windows a cada semana e certamente havia um momento em que isso era necessário. Hoje em dia, eu os reinicio apenas quando uma atualização exige. É claro que isso significa que eles ainda serão reiniciados a cada poucas semanas.

John Gardeniers
fonte
2

A Microsoft fez um ótimo trabalho ao melhorar o SO do servidor ao longo dos anos. E alguns servidores que você pode executar por 6 a 12 meses antes de começarem a ter problemas, outros apenas 2 a 3 meses. Tudo depende de quais serviços e aplicativos os servidores estão executando. Mas todos eles terão um problema em algum momento. Atualizações do Windows, vazamentos de memória, software imperfeito, são apenas alguns motivos.

Para nossos clientes com contratos de manutenção, instalamos atualizações e reinicializamos seus servidores mensalmente. Esses clientes têm uma indecência muito menor de problemas não planejados no servidor, da ordem de 1/5 do número de problemas que não são reinicializados regularmente.

Para aqueles que dizem que a reinicialização causa falha prematura do hardware, houve um tempo em que reiniciar discos e sistemas rígidos era um problema em potencial. No entanto, hoje os HDDs e outros componentes são construídos para suportar milhares de ciclos de parada inicial. Se o hardware do servidor estiver fraco, você preferiria saber em um momento controlado quando estiver lá para resolver o problema rapidamente ou uma falha aleatória com uma ligação no meio do dia útil informando que um departamento está inoperante?

Sinto que não há desvantagem nas reinicializações mensais regulares, enquanto as vantagens são claras e comprovadas ao longo do tempo.

Todd H
fonte
1

Confio nas atualizações do Windows para configurar minha 'agenda de reinicialização'. Deixe o Windows gerenciar a si mesmo .. pela primeira vez! Apenas muito raramente é necessária uma reinicialização com a nossa instalação devido a vazamentos de memória ...

louisnorthmore
fonte
1

Sou administrador de rede de uma empresa que opera em vários servidores Windows 2003 2008. Eu reinicio os servidores mensalmente, normalmente não aguardando mais de três meses, pois é muito crucial ficar inativo por esse curto período de tempo.

No entanto, com atualizações de patches e janelas, instalarei o WSUS em um controlador de domínio para aplicar atualizações etc. em um cronograma com base no meu gosto. Isso evita que os servidores se atualizem e reiniciem inesperadamente ...

GMitch
fonte
1

Todos os seus Windows Haters devem verificar os sites da Netcraft.com com os sistemas em execução mais longos por tempo médio de atividade ( http://uptime.netcraft.com/up/today/top.avg.html ). Isso mostra os sites que estão em execução há mais tempo desde a última reinicialização e 95% das 50 principais são máquinas Windows 2003 e 2000. Como sempre, sua milhagem pode variar.

Mark Lawrence
fonte
Talvez você não sabe muito sobre o balanceamento de carga ...
mfinni
0

Especificar apenas o Windows pode ser muito amplo para tomar uma decisão razoável. De fato, você tomará uma decisão melhor se considerar os serviços, funções e recursos executados na máquina Windows (por exemplo: Serviços Web, Servidores de Banco de Dados, etc.).

A qualidade e o comportamento de aplicativos e serviços da Web de terceiros executados em um servidor específico podem sugerir uma demanda de reinicialização mais / menos frequente da máquina Windows hospedeira do que outras máquinas sem elas.

Na verdade, alguns aplicativos de terceiros (um que não seja perfeitamente projetado; no entanto, ninguém é perfeito! ) Podem falhar ao liberar os recursos do sistema adquiridos, como memória, bloqueios e soquetes, de maneira graciosa e oportuna. Isso, por exemplo, pode manter alguns aplicativos, serviços ou drivers com falha [, quando reexecutados] no estado pendente ou inicial, o que pode não ser facilmente corrigido sem uma reinicialização.

Na prática, os aplicativos com I / O de disco, Rede e Memória com carga de trabalho alta e estressante e com poucos recursos de sistema disponíveis podem tornar a máquina Windows atrasada, instável ou lixeira, o que pode sugerir que você os reinicie mais cedo.

Se você precisar executar aplicativos defeituosos ou atender a mais usuários do que a capacidade típica de seu hardware / software, ou for forçado a co-localizar serviços incompatíveis em uma máquina física, poderá tomar a decisão de reiniciar o Windows. periodicamente. Nesse caso, você pode ajustar o período de reinicialização ouvindo as reclamações dos usuários sobre a velocidade do servidor!

FIV
fonte
-6

A resposta correta nunca é a menos que você faça a atualização do software. A última vez que reiniciei meu servidor há cerca de 2 anos e o motivo foi falta de energia.

Dmitriy R
fonte
3
Espero que você esteja, quer falando de um servidor linux ou Espero que o servidor não está em uso profissional ...
HTDutchy
3
Todo servidor que recebe patches precisa ser reiniciado para aplicar alguns desses patches. Qualquer servidor exposto a uma rede pública precisa ser corrigido.
Railmeat 27/05
Eu tenho alguns controladores de domínio NT 4 que são inicializados cerca de uma vez por ano. Não há mais atualizações e não alvo de bandidos muito mais ... (eles não estão virados para internet)
hsmiths