Problemas com "Whisker de zinco"?

8

Bom Dia;

Temos ocorrido falhas intermitentes de fontes de alimentação em nosso data center que foram atribuídas preliminarmente a "bigodes de zinco". Estou apenas começando a ler sobre eles (eu apenas pesquisei o termo no Google e comecei a escolher coisas), e estou interessado em outras experiências com eles e em qualquer experiência de limpeza e recuperação. Obrigado!

Dizzle
fonte
Prometi uma atualização (... há dois anos ... desculpe), e o exame microscópico revelou bigodes de zinco em algumas peças de uma fonte de alimentação com falha. Posteriormente, fechamos esse data center - que era mais como uma grande sala de servidores - em vez de renová-lo. Mais uma vez obrigado a todos que ofereceram suas idéias.
Dizzle

Respostas:

4

Você está perguntando sobre placas de circuito ROHS ou sobre revestimentos de zinco de pisos elevados e equipamentos de montagem em rack?

Não que isso importe muito ... já que são mais finos que um cabelo humano, geralmente devem queimar antes de se tornar um problema real. Eles também são grandes o suficiente para serem capturados, mesmo sendo o mais modesto dos filtros de ar.

Nas fontes de alimentação, elas geralmente devem queimar antes de se tornar um problema real. Revestimentos conformes ajudam. Eles são principalmente apenas um risco de sinalização em circuitos lógicos mais sensíveis que não têm revestimentos conformes (não são muitos os que estão ao redor).

Provavelmente, você apenas tem um fornecedor agarrando os canudos para explicar as opções de baixa qualidade para o OEM da fonte de alimentação. Seria bom se você pudesse nomear nomes e números de modelo. Isso pode trazer mais respostas (e mais úteis).

kmarsh
fonte
Obrigado kmarsh; nosso problema foi principalmente com fontes de alimentação para equipamentos Sun (servidores V480, matrizes 3310 SCSI) servidores Apple (servidores X de primeira geração) e servidores Dell (PE 2650, 2850, 650, 1850). Perdemos 37 ao longo de um ano até agora (a maioria falhou em duas ocorrências maiores e separadas), mas a solução de problemas de nossos eletricistas chegou a um beco sem saída. E para esclarecer, estou perguntando sobre a versão do piso elevado do problema. Estávamos perto de atribuir isso ao nosso fornecedor de fontes de alimentação de escolha, mas depois que ele se espalhou para outros equipamentos, fomos forçados a procurar em outro lugar.
Dizzle
Interessante. Há também anomalias de energia e problemas de aterramento ... estes são difíceis de depurar quando não estão ocorrendo no momento.
Kmarsh
Uma coisa que é um pouco consistente (talvez cerca de 30% do tempo), se os painéis do piso forem removidos e substituídos, haverá uma falha na fonte de alimentação correspondente. Eu quase acho que colocar o último painel do piso no lugar "sela" o chão, mas empurra o ar abaixo do piso para um ponto de fuga que passa a ser o espaço sem painel sob as prateleiras afetadas? Apenas compreendendo e adivinhando ... nosso próximo passo é examinar as fontes de alimentação sob um microscópio. Você mencionou que eles deveriam ser queimados; então eu estou pensando, por que alguns e não outros. Talvez eu veja quais são as opções de visualização temporária.
Dizzle
+1 no comentário "queimando" - Em qualquer circuito com corrente real (como uma fonte de alimentação), espero que os bigodes se vaporizem quase instantaneamente. O meu entendimento é que eles são mais uma preocupação em circuitos lógicos baixa corrente onde podem introduzir erros sutis
voretaq7
@Dizzle - Interessante que o problema pareça estar relacionado à remoção dos painéis de piso; Que tipo de trabalho está acontecendo enquanto o chão está aberto? Se alguém tocar na energia (por exemplo, em um ônibus de serpentes) que possa produzir falhas elétricas que perturbam suas fontes de alimentação.
voretaq7
1

Eu nunca tive uma falha que eu poderia atribuir aos bigodes de zinco / estanho, embora meu conjunto de amostras não seja enorme e eu realmente nunca tenha tido uma série de falhas na fonte de alimentação, como você descreve, que me levariam a uma busca por uma causa raiz.

Eu estaria olhando para problemas mais convencionais (capacitores ruins na fonte de alimentação ou uma taxa de falha elétrica transitória bastante alta, especialmente porque você diz que teve duas "grandes ocorrências" de falhas na fonte de alimentação), embora pareça que você já tem.


Minha lista curta, caso seja diferente da sua / do seu eletricista:

Eletricamente: energia mal estabilizada devido a um no-break ou PDU / CDU instável, falhas de aterramento, etc. Se suas "grandes ocorrências" ocorreram em áreas servidas pelo mesmo equipamento de distribuição de energia, isso se tornará mais provável.

Ambientalmente: temperatura e umidade; Verifique a temperatura de entrada / saída do seu equipamento (especialmente se as falhas ocorrerem na mesma área física do datacenter: Você pode descobrir um problema de fluxo de ar / resfriamento, causando o aquecimento do seu equipamento).

CQ do equipamento / fabricante: verifique as fontes de alimentação esgotadas quanto a capacitores abaulados / soprados, especialmente se as falhas ocorrerem em unidades compradas na mesma época. Certifique-se de não pressionar demais as fontes de alimentação (muitos discos rígidos e CPUs com muita energia podem exigir uma fonte de alimentação maior)

voretaq7
fonte
Sim, você atingiu cada ponto que nossos eletricistas atingiram. A unidade CA / umidificador foi reinspeção; o primeiro incidente grave danificou o no-break (uma unidade autônoma de 16KVA) e um novo no-break foi instalado devido à idade / custo do reparo da unidade antiga, mas ocorreram mais incidentes depois (nada de incomum nos registros do no-break ou PDU PDUs também são novos); várias das fontes de alimentação com falha foram quebradas e abertas pelos eletricistas e comparadas com as novas.
Dizzle
Uma vez que todas as coisas óbvias foram atingidas, os bigodes (ou outros bits condutores flutuantes) estão definitivamente dentro dos limites - Seria muito interessante se você pudesse rastrear conclusivamente essas falhas em bigodes.
voretaq7
Neste momento, estamos apenas aguardando o exame ao microscópio, que espero que seja na próxima semana, mas decidimos colocar o espaço em quarentena por enquanto e planejamos mudar as coisas para centros de dados alternativos. Ouvi dizer que a recuperação disso envolve a limpeza (e possivelmente a substituição) dos painéis de piso e a limpeza de todo o resto da sala. Se eu receber um diagnóstico concreto, definitivamente atualizarei isso; obrigado novamente pelo seu tempo.
Dizzle