Os servidores devem ser desligados à noite?

144

Existe um servidor usado das 4:30 da manhã às ~ 22:00.

Deve ser desligado? Eu acho que é um servidor e que não terá problemas para permanecer, mas professores sérios estão me dizendo que é perigoso e que o HD pode falhar dentro de 2 anos. O proprietário do servidor acredita que seu servidor antigo rodando a partir de 1995 sem backup e um único disco rígido (se o disco rígido falhar, ele está ferrado) não teve nenhum problema porque ele costumava desligá-lo à noite.

Em que você acredita nisso?

Agora, ele possui uma matriz RAID 1, backup em disco rígido externo e backups completos em disco do servidor em DVD e pela Internet.

GorillaApe
fonte
62
+1 porque, embora essa seja uma pergunta que eu acho que nenhum de nós jamais pensou nisso, claramente algumas pessoas o fazem e precisa ser respondida.
Mark Henderson
8
Seus professores não estão executando servidores. Eles estão executando estações de trabalho com daemons de rede.
Bacon Bits
4
Você não pode usar algumas configurações de energia para reduzir os discos rígidos quando não estão em uso? O mesmo benefício em termos de desgaste, mas você não precisa desligar toda a máquina.
Brendan Long
34
Professores de Inglês Lit?
Iain Titular
28
Eu não recomendaria seguir conselhos de pessoas que não fazem backups. Especialmente se eles fizerem isso por mais de 15 anos. Economizar energia elétrica é o único argumento para desligá-lo. A vida útil será reduzida devido ao aquecimento e resfriamento todos os dias.
Malte

Respostas:

153

Para compará-lo a uma analogia de carro: um táxi pode percorrer mais de 500.000 quilômetros antes de precisar de uma reforma no motor. A razão para isso é que eles sempre estão funcionando 24 horas por dia, 7 dias por semana, e depois que o motor de um carro atinge a temperatura, a quantidade de desgaste que ele recebe enquanto está em funcionamento é bastante reduzida.

Um computador é o mesmo. A maioria do "desgaste" das peças pode ocorrer quando o servidor está inicializando. Basta conectar um amplificador ao seu computador e ligá-lo. Quando é inicializado, a energia consumida sobe muito alto e, em seguida, se instala quando todos os discos aumentam e o processador é inicializado. Além disso, pense em quanta atividade de disco o servidor sofre durante a inicialização ou quando está funcionando. Provavelmente, o acesso ao disco durante a inicialização do sistema operacional é uma atividade bastante sólida, enquanto quando o sistema operacional está em execução, a menos que seja um servidor de banco de dados muito pesado (acho que não), os discos provavelmente ficarão inativos. Se houver algum momento em que ele falhará, é provável que esteja na inicialização.

Ligar e desligar o servidor é uma ideia estúpida. Além de mencionar que a maioria dos servidores pode levar de 2 a 5 minutos para passar pelas verificações do BIOS, também é uma quantidade enorme de tempo perdido.


Atualização de 2018: Como a maioria dos computadores agora é essencialmente totalmente sólida, essa resposta pode não ser mais precisa como era antes. A analogia do táxi realmente não se adequa aos servidores modernos de hoje. Dito isto, normalmente você ainda geralmente não desativa os servidores.

Mark Henderson
fonte
15
Você poderia adicionar alguns links para pesquisar esse tópico?
Mafu
15
@mafutrct: o WikiBook on HD Failure e o Google Labs Study on HD Failure mostram evidências inconcursivas para sugerir que os ciclos de energia afetam a vida útil da unidade, e o tempo de atividade total não chega a ser um lote / sorte do sorteio. Também coisas óbvias, como trauma físico, têm mais efeito.
Chris S
3
Como eles abastecem o táxi se ele está sempre funcionando? Isso é ilegal na maioria das jurisdições.
Lightness Races in Orbit
8
@Tomalak - bem, o ponto da analogia era que o motor do táxi estava em temperatura alta e menos desgaste ocorre durante esse período. Nos 90 segundos necessários para reabastecer um táxi, o motor não tem chance de esfriar e, portanto, o desgaste ainda é diminuído. Em um computador, ele é "resfriado" (para os fins da analogia) instantaneamente, e cada início é um começo "frio".
Mark Henderson
6
@ Fergus - bem, isso se aplica apenas a caixas físicas. Se você tiver uma VM, ligue / desligue o quanto quiser. Mas você não terá nenhuma economia de vida ou energia com isso.
Mark Henderson
70

Desligar e ligar o servidor todos os dias provavelmente causaria uma falha mais rápida do que deixá-lo ligado.

HostBits
fonte
3
Provavelmente devido ao estresse do disco @ boot; Além disso, eu tinha um servidor que funcionava felizmente por anos e depois me recusava a aparecer na reinicialização. Acontece que o disco de inicialização estava se degradando lentamente, com o MBR completamente ilegível - mas o MBR era lido apenas durante a inicialização, para que ninguém percebesse. Felizmente, o disco morreu completamente somente após uma corrida frenética para recuperar o que ainda não havia sido feito backup.
Piskvor
Duvido que isso aconteça com a desativação uma vez por dia, até os discos corporativos têm uma contagem de 300.000 em seus detalhes técnicos. O problema vem do gerenciamento de energia, que ocorre a cada 15 minutos.
Lothar
Eu não entendo como uma resposta que declara apenas os pensamentos de alguém sem raciocinar o que já recebeu 70 votos positivos.
Bassie-c 6/06
52

A única coisa que posso ver que está quase certa sobre o que foi informado é que as unidades podem falhar dentro de 2 anos. De fato, eles podem falhar a qualquer momento. Tenho certeza de que a maioria de nós recebeu pelo menos uma nova unidade que era DOA. Em média, as unidades de servidor duram cerca de 3 anos ou mais, com 10 ou 20 anos não sendo muito incomuns. Isso não significa que nenhuma unidade individual falhe muito antes.

Servidores (ou seja, uma máquina com componentes de nível de servidor adequados) são projetados para serem executados continuamente. Não há motivo para desligá-lo à noite, mas há algumas boas razões para deixá-lo funcionando. Durante a noite, ou qualquer outro horário "silencioso" para um determinado sistema, é hora de executar toda a manutenção e automação.

por exemplo, é melhor fazer backups quando há pouca ou nenhuma atividade do usuário. Isso ajuda a garantir que os backups sejam consistentes. Claro que existem maneiras de contornar isso, mas por que não dar a seus backups todas as chances de sucesso quando não há nada a perder com isso?

Alguém executando um "servidor" com um único disco e sem backup é um tolo, não um administrador. A única razão pela qual ele se safou é pura sorte. Não tinha absolutamente nada a ver com o desligamento da máquina à noite.

John Gardeniers
fonte
Vou adivinhar aqui e dizer que o "administrador" que não está fazendo backups também não está usando componentes de nível de servidor adequados.
intuited
23

Os servidores devem operar 24x7. Desligar servidores durante a noite é extremamente incomum. As unidades de disco rígido do servidor foram projetadas para serem mais confiáveis ​​que as unidades de desktop e agora que você possui backups e RAID 1, não sofrerá perda de dados se uma das duas unidades falhar.

O que me preocuparia agora para este servidor de 16 anos é uma placa-mãe ou falha na fonte de alimentação não redundante.

Zero Sub-rede
fonte
Parece lógico :) É um motorola pc power pc .. ainda não morreu!
precisa saber é o seguinte
13

Eu nunca desliguei um servidor à noite antes.

Os discos rígidos falham quando falham. Ligar e desligar a máquina não tornará a unidade mais lenta. Vi discos rígidos enviados pelo fornecedor que já eram ruins e vi discos rodando (e sendo usados ​​ativamente) por mais de 5 anos sem falhar.

Seus professores são idiotas.

mrdenny
fonte
2
Ligar e desligar a máquina definitivamente fará com que a unidade falhe mais lentamente se for deixada fora por longos períodos de tempo. Se você desligar a máquina por 10 anos, é garantido que a unidade dura mais ou menos 10 anos. A questão é quanto tempo a máquina média precisa ser deixada de lado para ter um efeito positivo.
intuited
4
@intuited Se você ligar a máquina após 50 anos de espera e a unidade falhar na inicialização, ela durou 0 anos, 50 anos ou o quê?
Cade Roux
@Cade Roux: Eu não tenho idéia. O que isso importa? Mesmo se contá-lo como 0, esse erro não alterará significativamente a média geral.
intuited
11
@intuited que era uma piada - mas, na verdade, ele provavelmente vai distorcer a média research.google.com/archive/disk_failures.pdf E a partir desses dados, é possível que uma nova unidade ligada depois de se sentar na prateleira a 5 anos será maior probabilidade de falhar do que uma unidade funcionando por 5 anos. O ponto é discutível, porque não compensa deixar o hardware ocioso mais do que desligar e ligar novamente. O hardware degrada e obsoleta e precisa ter seu valor máximo usado antes de se desgastar e de ser substituído.
Cade Roux
@Cade Roux: a partir da pesquisa do Google ao qual você vinculou: Como é comum em implantações de classe de servidor, os discos foram ligados, girando e geralmente em serviço durante praticamente toda a vida útil deles. Portanto, essa pesquisa não é relevante aqui. Isso mostra que a unidade ainda nova terá mais probabilidade do que a antiga de falhar durante um determinado período de tempo após ser ligada novamente, mas isso pressupõe que a antiga ainda não tenha falhado durante os cinco anos em que foi corrida.
intuited
11

Isso também coloca um "aspecto humano" maior no servidor. Mesmo se você usar as configurações de energia para desligá-lo e ligá-lo nos horários corretos, peça a alguém que monitore o servidor para garantir que todos os serviços necessários etc. sejam iniciados corretamente. Esse é um tempo precioso que você pode ensinar aos professores sobre backups e RAID.

Quando você executa backups? Eu daria tudo por uma janela de 6 horas para executar meus backups diários, atualizações, hotfixes, etc. Se nada mais, esse tempo de inatividade pode ser usado para isso.

Eu o desafio a ir a esses "professores sérios" e fornecer pesquisas mostrando que deixar o computador 24x7 é ruim para ele. Eu gostaria de fazer backup do que eles estão dizendo.

Theo
fonte
Eu disse sério, porque um deles projetou processadores, os sistemas embarcados conhecem o kernel do linux em grandes detalhes. Quanto aos backups, criei scripts para backup automático, mas o proprietário e o administrador pareciam-me com o WTF. "NÃO, eu quero fazê-los manualmente diariamente" e não "tar e comprimir".
precisa saber é o seguinte
2
@Parhs Simplificando, você é mais esperto do que seus superiores. Seria sensato da sua parte desistir e encontrar um mentor real antes de passar muito tempo na sombra de idiotas que não deixarão você fazer a coisa certa.
Skyhawk
10

Realisticamente, espera-se que a maioria dos servidores esteja disponível 24/7. Claro e simples.

Na hipótese de a sua não ser, existe muito debate entre o que causará mais desgaste no servidor, a constante expansão e contração entre ligar o servidor e aquecê-lo e depois desligá-lo e deixá-lo esfriar ou o desgaste dos componentes devido ao uso constante.

Ainda não vi nenhuma pesquisa pior, e duvido muito que o seu professor tenha acesso a algumas pesquisas que alegam diferentemente.

No final, você terá que tomar a decisão com base em suas necessidades, mas o custo-benefício para a maioria das empresas é ter seus servidores e serviços disponíveis o tempo todo, não apenas quando alguém entra e o liga. Especialmente quando há um debate em que você pode estar causando mais problemas para seus servidores, desativando-os.

Rfelsburg
fonte
7

O que é mais importante é o resfriamento. O resfriamento faz uma grande diferença. A temperatura dentro da caixa pode ser muito maior que a sala. Eu instalaria um software para monitorar isso como o everest. Comparando o disco rígido moderno com o que você substituiu, eles ficam quentes. Alguns precisam de fãs para resfriá-los Às vezes, um pequeno fã pode fazer uma grande diferença. A vida do HD e do servidor dependerá do resfriamento.

Joe em Michigan
fonte
5

Sim, não é uma opção. Diga a seus professores que o padrão do setor é deixá-los funcionando 24 horas por dia, 7 dias por semana e ter garantia de hardware com falha. Se o servidor tiver 16 anos, imagino que você não receberá essa garantia.
Se o servidor explodisse, que tempo de recuperação você teria para criar um novo com as informações de backup? Eu começaria a sugerir aos clientes que seu servidor chegou ao fim da vida útil e eles deveriam começar a procurar fundos para um novo.

xXhRQ8sD2L7Z
fonte
5

É verdade que as tensões mecânicas do ciclo de potência são difíceis para o disco rígido. Além disso, havia algumas unidades mais antigas que (quando esfriadas o suficiente) podiam parar de funcionar por causa de "aderência".

Com circuitos inadequadamente projetados, correntes de irrupção ao ligar a máquina também podem sobrecarregar alguns componentes, embora isso não seja tão provável.

Dito isto, há alguma verdade que deixar a máquina onerosa custa muito: capacitores. Os numerosos capacitores eletrolíticos na placa-mãe provavelmente são o elo mais fraco da confiabilidade do sistema. Esses capacitores são classificados por sua capacidade de manuseio de corrente / tensão, temperatura operacional e vida útil. Os capacitores típicos serão classificados por vários milhares de horas. As tampas para serviço pesado / longa vida são classificadas para várias dezenas de milhares de horas e temperaturas mais altas.

É por isso que às vezes você vê placas-mãe à venda com "capacitores de servidor" - porque essas máquinas operam a toda velocidade 24x7 e permanecem na vida útil da placa-mãe.

Construtor de brinquedos
fonte
Há mais de 15 anos, ouvi o termo 'estatística do disco' ou algo parecido, a explicação dada foi que, após anos de funcionamento, os polímeros nos lubrificantes de disco começam a formar cadeias longas e quando o disco é desligado e para de girar os rolamentos aproveitar e não recomeçará '. Falhas de energia em um controlador de domínio geralmente significavam que vários servidores não seriam reiniciados. Obviamente, não tenho idéia de quais discos usam como / em vez de rolamentos agora.
JQA
+1 para estrição. Eu queria saber se alguém iria mencionar isso. @james, é chamado de "estrição", e tem havido muito trabalho para obter lubrificantes para as unidades que não engrossam com o tempo, uso / abuso. As coisas estão melhores do que costumavam ser, mas ligar e desligar os inversores ainda não é uma boa ideia, porque é mais provável que eles morram quando a energia atingir, seja porque um componente sopra ou porque os motores não conseguem começar a girar os pratos.
Greg
A maioria das placas-mãe produzidas a partir de 2008 (talvez mais cedo) agora usam capacitores de estado sólido, que têm uma vida útil MUITO MUITO maior do que as eletrolíticas. Agora, as fontes de alimentação são o único local em que você ainda vê capacitores eletrolíticos.
Mircea Chirea
Isso é aderência (vara + fricção), não estrição. :-)
kindall
2

Quando tive um servidor recebendo manutenção preventiva mensal do fabricante, eles começaram com um desligamento todo mês. Isso tendia a resultar em falhas de componentes. A programação foi alterada para trimestral e depois somente quando necessário. Eu não recomendaria desligar um sistema tão antigo, a menos que fosse necessário.

BillThor
fonte
Sim, também vi servidores com mais de 1000 dias de atividade. Mas não reiniciar regularmente (quente) é um pecado; é melhor encontrar um sistema com falha após uma reinicialização planejada do que após um sistema não planejado. Além disso, essas reinicializações tendem a descobrir contratempos na configuração.
sjas
1

Uma coisa não mencionada é que a maioria dos servidores tem tarefas de manutenção que eles realizam diariamente, semanalmente ou mensalmente. Estes são quase sempre agendados para o meio da noite, quando a atividade deve ser mais baixa.

Em um sistema Red Hat, por exemplo, essas atividades começam às 04:02 do horário do servidor. Dependendo do servidor, eles podem ser executados por alguns segundos a uma hora ou mais. Se você ativar o servidor às 4:30, essas tarefas de manutenção serão iniciadas imediatamente (pela anacron) e os primeiros usuários a efetuar login entre então e 5 horas serão afetados até certo ponto.

Michael Hampton
fonte