Práticas recomendadas de firmware e agendas de atualização

12

O firmware recebe muito pouca atenção quando se trata de atualizações. Fora da vista, longe da mente.

Muitos dispositivos: controladores RAID, placas de rede, chipsets e até discos rígidos obtêm alguns benefícios ao serem atualizados. Melhores recursos, segurança / correções de bugs, etc.

A maioria das SA diz: "Sempre que quebrar, atualize o firmware". Mas isso pode levar a dificuldades no caminho; Várias vezes, ao entrar em contato com a Dell sobre uma falha no disco rígido, fui perguntado se o firmware do meu disco rígido está atualizado. Todos os meus servidores usam algum tipo de configuração RAID. Se eu já tenho uma única falha na unidade, devo considerar tentar atualizar o firmware nas demais unidades ou no controlador RAID? Eu diria que não. Mas a Dell parece ter uma visão diferente.

  • O que é um cronograma de atualização realista para o firmware do sistema?
  • Você tem alguma prática recomendada para compartilhar?

(Estou ciente de que a Dell possui um bom utilitário chamado Server Update Utility , que verifica todos os novos firmware em qualquer servidor Dell.)

Joseph Kern
fonte

Respostas:

10

Eu atualizo o firmware em duas instâncias principais.

  1. Ao preparar um servidor.
    • Quando eu conseguir o servidor, vou verificar no site da HP a data do último "CD de atualização de firmware". Se for novo o suficiente, executarei no servidor antes de colocá-lo em produção.
    • Quando eu redireciono um servidor. Normalmente, esse servidor tem de 2 a 5 anos e provavelmente não teve uma atualização de firmware durante todo esse tempo. Como estou reformatando mesmo assim, atualizarei todos os firmware diferentes no servidor.
  2. Quando há um fornecedor identificado, é necessário fazê-lo.
    • Às vezes, existem grandes problemas de estabilidade identificados, como a incapacidade de reconstruir uma matriz RAID5 após o tipo errado de falha ou um bug de desempenho importante no mecanismo de descarregamento de TCP na NIC.
    • Às vezes, ao ligar para o suporte, o técnico de suporte solicita a atualização do firmware. Eu farei isso então.

Há uma terceira instância que não listei acima, porque ainda não aconteceu:

  • Ao colocar um componente muito mais recente em um servidor mais antigo. Às vezes, o BIOS do sistema precisará ser atualizado para lidar com isso.
sysadmin1138
fonte
Eu acho que isso atinge um excelente equilíbrio.
18119 Joseph Kern
5

Usamos o HP SIM (System's Insight Manager) para lançar o firmware, fazemos por plataforma - teste primeiro, depois desenvolvimento, integração e referência e finalmente produção - geralmente cerca de uma semana por plataforma, para que tenhamos um 5/6 liberação da semana para a janela de produção. Parece funcionar, mas uma coisa que NUNCA fazemos é lançar o firmware ao mesmo tempo que outras atualizações, como drivers / código, etc. - economiza bastante apontar o dedo.

Chopper3
fonte
+1, dedo apontando, uma ocorrência muito comum ... parece que toda terça-feira ...
Joseph Kern
4

Eu posso estar indo contra a corrente aqui, mas se não estiver quebrado, não conserte. Se não é um problema de segurança, deixo-o em paz.

Eu nunca tive a Dell negar serviço por esse motivo.

Talvez você possa agendar o utilitário uma vez por mês e atualizá-lo com outras reinicializações?

MathewC
fonte
+1 por falar a verdade. Se não há um bom motivo para atualizar (como o fornecedor não oferece mais suporte ao seu kit, a menos que você atualize o BIOS / firmware), por que está fazendo isso?
21449 RainyRat
Não trabalho com o suporte da Dell, mas ainda estou com um problema que a Intel não suporta até atualizar meu BIOS - só não consigo atualizar o problema e às vezes me pergunto se é porque o único disponível update é muitas versões antes do que meu servidor está executando.
Ben Dunlap
1
Em princípio, eu concordo com você, mas temos alguns servidores que são significativamente mais rápidos e estáveis ​​agora do que quando comprados, devido a melhorias no firmware.
Chopper3
Acordado. Eu acho que problemas de desempenho podem ser considerados "quebrados" neste caso.
MathewC 18/06/09
Para constar, recentemente a Dell negou a substituição do disco rígido em um servidor PowerEdge até atualizar o firmware do controlador RAID para a versão mais recente.
22139 Ryan Bolger
4

Você deve tratar as atualizações de firmware da mesma forma que as correções , embora essas atualizações sejam geralmente mais difíceis de implantar. Portanto, convém verificar as notas de versão para ajudar a decidir se vale a pena o esforço (mas, novamente, você também pode fazer isso nas correções) ) As atualizações de firmware têm a mesma probabilidade de conter um novo bug desagradável do que o de corrigir um.

A atualização do firmware deve ser feita ao comissionar (ou ao comissionar novamente o hardware), pois é um momento fácil para fazê-lo.

A implantação deve seguir aproximadamente algo nesse sentido:

  1. Teste em máquinas de laboratório
  2. Implantar em sistemas sem importância
  3. Esperar
  4. Implantar em sistemas importantes / de produção

Por outro lado, algumas coisas não podem seguir isso. Em particular, é muito importante enviar rapidamente os patches da Microsoft para as áreas de trabalho do Windows, e é difícil fazer testes rapidamente sem recursos significativos.

Toto
fonte
2

Normalmente atualizarei o firmware ao comissionar qualquer novo equipamento de infraestrutura. As estações de trabalho e as impressoras somente são atualizadas se houver um problema específico, como uma correção de bug necessária ou um problema de segurança. É menos importante com os servidores, pois, na maioria das vezes, o código do firmware não é executado além do processo de inicialização ou é tão simples que pouco há para dar errado.

Tive experiências ruins com a atualização do firmware RAID em servidores, pois muitos fabricantes não garantem que a configuração RAID atual será viável se a versão do firmware mudar, o mesmo com discos individuais na matriz.

Minha tendência seria aplicar a política "se não estiver quebrada, não conserte" em sua maior parte. Vale a pena verificar se é possível recuperar-se de uma atualização de firmware ruim (por exemplo, ROM redundante nos servidores HP ou se você possui um pisca-pisca EEPROM e deseja usá-lo como um chip removível).

Richard Slater
fonte
Com que frequência você verifica "problemas de segurança" em todos os seus diferentes firmware?
18119 Joseph Kern
Praticamente todo o nosso kit é da HP. Ao registrar o produto, inscrevo uma conta genérica para "notificações sobre problemas de firmware, drivers e segurança"; se eu sair, redirecionarei essa conta para meu sucessor.
Richard Slater
2

Não posso falar na Dell, mas muitos profissionais do grupo de armazenamento IBM me disseram há muitos anos que os primeiros níveis de seu firmware RAID NUNCA são os melhores. Eles buscam a estabilidade primeiro e depois aumentam o desempenho com níveis futuros de rotação. Infelizmente, poucos de nós pensariam (ou talvez tenham o moxie) em voltar mais tarde e mexer com o firmware RAID do sistema saudável, a menos que houvesse problemas. Portanto, nossa estratégia tem sido atualizar os níveis de firmware RAID toda vez que configuramos um novo servidor, supondo que o adaptador RAID não seja um novo modelo de marca. Dessa forma, pelo menos obtemos os melhores níveis de desempenho disponíveis no momento. Se for um novo adaptador de modo, tentamos fazer uma anotação mental para voltar em alguns meses e procurar atualizações, mas não somos religiosos.

Nas placas-mãe, NÃO as mexemos, a menos que o suporte técnico do fornecedor nos informe. Nossa experiência ao longo dos anos tem sido que, a menos que haja um problema específico que precise ser corrigido, os riscos superam amplamente os benefícios difíceis de medir.

// spk

Scott Kantner
fonte
1

Eu usei o SUU e produtos similares da HP e IBM com sucesso. Os únicos problemas que eu já encontrei foram quando um driver de fornecedor foi usado para substituir um driver da Dell, por nenhum motivo técnico, o que causou a falha na atualização da SUU na atualização da OM em um servidor Dell. Corremos atualizações de firmware e drivers em várias centenas de servidores pelo menos duas vezes por ano para mantê-los atualizados. Nunca tivemos problemas com o firmware RAID.

Mitch
fonte
Diga-me mais ...
Joseph Kern
Seguimos os lançamentos da Dell, trimestralmente, para agendar as alterações para aplicar as atualizações. Nós os aplicaríamos a todas as máquinas Dell em todos os clientes suportados. Talvez tenhamos tido sorte, mas tendo tido muito poucos problemas, acho que também se tratava de ter um plano e manter as coisas atualizadas. Quando contratamos novos servidores, uma das primeiras coisas que fizemos foi trazer todos os produtos para o nível atual.
Mitch
1

Atualizamos o firmware a cada chance que temos, o que infelizmente é de 3 a 4 vezes por ano (principais janelas de manutenção) para alguns sistemas.

Jason Tan
fonte
0

Se você ler a sinopse que acompanha uma atualização de firmware da Dell, verá que ela classifica a atualização como crítica, importante ou o que for, e descreve o que a atualização corrige (nem sempre da maneira mais clara que se deseja!).

Minha opinião é que não aplicarei uma atualização de firmware sem uma boa razão. Se é uma atualização crítica e corrige um problema que eu tenho uma chance razoável de encontrar, sim, eu a aplicarei mesmo que seja um negócio estressante.

Como você diz, o suporte da Dell normalmente insiste em aplicar quaisquer atualizações relevantes antes que elas o ajudem, e obviamente nesse caso você não tem muitas opções de escolha. Você pode entender que a Dell não deseja perder tempo com o engenheiro, mesmo que eu nunca tenha conhecido o firmware como a causa de uma chamada de suporte.

JR

John Rennie
fonte
0

Eu acho que depende do tipo de ambiente com o qual você tem que lidar. Se você trabalha em um ambiente que requer alta disponibilidade e não pode reiniciar servidores quando quiser. A melhor prática na minha opinião é implementar um cronograma de manutenção. Selecione um período de tempo para cada sistema, notifique os usuários e execute todo o trabalho necessário, incluindo atualizações de firmware durante esse período de tempo alocado. Dessa forma, você pode ter certeza de que todos os seus sistemas estão atualizados e minimizar o impacto na produção ao mesmo tempo. Além disso, como foi observado nos comentários anteriores, é necessário verificar se há atualizações de firmware ao criar um novo servidor.

user176320
fonte