Como tornar a unidade de disco rígido da máquina de fábrica mais durável? Quanto tempo de vida útil estimado?

9

Gostaria de saber como posso tornar a unidade de disco rígido mais durável? Especificamente, eu trabalho em um ambiente de fábrica. E quase todos os meses, a unidade de disco rígido em algumas máquinas da fábrica está corrompida e até não pode ser reparada. Já implementamos vários SSD em alguns deles, mas isso não ajuda muito. Eles também estão sendo corrompidos em máquinas de fábrica com tarefas pesadas.

Então, sempre que isso acontecia, sempre restaurávamos usando nossa imagem de backup. E já conectamos toda a unidade de disco rígido com amortecedor para reduzir a trepidação.

Existe alguma outra opção ou prevenção que possamos usar? Talvez adicionando algum material anti-ímã para evitar o atrito do ímã ou algo mais? E de que material precisamos?

Edit: Máquina de fábrica com tarefas pesadas, menciono acima basicamente máquina para criar carroçaria de metal e molde de estrutura de carro.

E quando eu quis dizer que o disco está corrompido, significa ilegível. O disco inteiro. Não são os arquivos do programa ou o software relacionados. Portanto, não será inicializado.

adadion
fonte
10
SSDs não devem ser afetados por ímãs. Os problemas mais prováveis ​​são temperatura, umidade, contaminação química (levando à corrosão das conexões elétricas, etc.), poeira e sujeira (impedindo o resfriamento adequado do ar) ou a fonte de alimentação elétrica fora da especificação - por exemplo, picos de energia causados ​​por grandes motores elétricos parando e começando. Sem saber mais sobre a "fábrica", é impossível adivinhar o que é mais importante.
alephzero
@alephzero Desculpe, a máquina de tarefas pesadas que mencionei acima é a máquina de fábrica para fazer o corpo do carro e o molde da moldura. Você pode compartilhar uma solução possível com base na sua experiência em relação aos meus problemas? Porque isso só acontece com máquinas com tarefas pesadas.
adadion 13/06
6
Os discos rígidos contêm componentes mecânicos muito sensíveis, portanto, eu recomendaria definitivamente o uso de unidades de estado sólido para todos os locais em movimento / vibração. No entanto, ao ler o seu problema, acho que o seu principal problema também tem a chance de ser um problema de alta tensão. Se sua entrada de energia não for estável, ela afetará a leitura e gravação e, eventualmente, danificará alguns componentes.
Jonathan
4
Tem certeza de que esse é realmente um problema de hardware e não está relacionado ao software? Entendo problemas com unidades de disco rígido, mas os SSDs devem estar imunes à maioria desses problemas. Você pode fornecer mais detalhes sobre a "corrupção" que vê?
jcaron
1
Além de um no-break, considere usar dois (ou mais) SSDs em uma configuração RAID1. Se você configurar o monitoramento de erros RAID, isso permitirá que você substitua uma unidade com falha sem precisar restaurar a partir do backup.
Tor Klingberg

Respostas:

14

Muito provavelmente, o assassino SSD é elétrico. Não podemos descartar inteiramente a vibração mecânica, mas os SSDs são bastante robustos mecanicamente. Uma montagem simples de borracha aumentaria ainda mais a resiliência. Verifique também se os cabos de alimentação e de dados têm folga suficiente. A vibração pode fazer com que se soltem quando estão sob tensão.

Portanto, para lidar com a confiabilidade elétrica, precisamos considerar dois fatores. Em primeiro lugar, as máquinas pesadas podem extrair grandes correntes da fonte de alimentação. Isso pode causar quedas de tensão, o que, por sua vez, pode afetar negativamente o SSD. Isso é facilmente resolvido por um no-break online. Essencialmente, esse tipo de no-break alimenta o computador a partir de uma bateria, enquanto a energia principal é usada para carregar a bateria.

Um problema mais incomum pode ser a radiação eletromagnética. Máquinas de alta potência terão grandes correntes em funcionamento, geralmente a 50 ou 60 Hz. Involuntariamente, isso fará com que os cabos atuem como antenas. Os grandes cabos da máquina atuam como remetentes e os cabos do SSD podem atuar como receptores. A solução aqui é ter uma gaiola adequada de Faraday, idealmente aterrada. É por isso que as caixas de PC normais são feitas de metal; eles funcionam como gaiolas de Faraday, mantendo a radiação EM em faixas de frequência entre 50 Hz e vários Ghz.

MSalters
fonte
5
+1 por mencionar efeitos eletromagnéticos. (Não sei quão sério isso seria para os casos de PC que estamos considerando).
Gürkan
Eu também acho que é a resposta do problema, mas não da pergunta do título :) você recebe meu voto de qualquer maneira.
Jonathan
É inteiramente provável que a maquinaria pesada está causando problemas com o fundamento de que pode ser atenuado por motivos isolados.
chrylis -on strike-
1
Parece que as quedas de tensão são os principais problemas. Implementamos alguns no-breaks online para alguns deles e o medidor mostra um ótimo resultado estável. Além disso, colocamos a gaiola Faraday aterrada em 2 deles (os antigos). Soberbo !! Will projetado SSD instalado em todos eles, e fazer o antigo como backup.
adadion
11

Primeiro, problemas elétricos e magnéticos não são tão ruins quanto problemas de vibrações e contaminação do ar. A umidade do ar, além de poeira ou produtos químicos, pode corroer ou curvar caminhos com muita facilidade e, em nossas instalações, são os principais motivos de falhas se os dispositivos não estiverem protegidos adequadamente.

A melhor opção é manter tudo o que não é necessário no local de produção fora do local. Mantenha controladores embarcados minimalistas junto às máquinas, mantenha os PCs em um escritório limpo, comunicando-se com os controladores pela LAN.

Se isso não for possível, você precisará de caixas seladas. Possivelmente com elementos de transferência de calor, se necessário; caixas herméticas que mantêm a maior parte da umidade afastada, alguma sílica no interior para absorver o restante da umidade - nem a poeira seca nem a umidade do ar limpo são um grande problema, mas combinadas elas rapidamente levam à oxidação dos contatos, outros problemas relacionados à corrosão.

Na minha experiência, os distúrbios EM raramente são poderosos o suficiente para causar danos duradouros. Eles podem nocautear um dispositivo, forçando uma reinicialização, mas um dispositivo bem construído se recuperará disso. Os surtos de energia são uma questão diferente; sem uma boa proteção contra sobretensão, você poderá ver danos aleatórios nas peças.

Finalmente, vibração. A vibração conduzida pelo piso é facilmente reduzida a níveis desprezíveis através de um tapete de esponja ou similar. A vibração de uma máquina, caso o dispositivo esteja diretamente conectado à máquina ... há pouco a fazer sobre isso. Existem sistemas de amortecimento, mas eles só são eficientes contra certas escalas de vibração ... realmente, basta mover a caixa de controle a 2 metros de distância.

Além disso, a faixa de temperatura deve estar "dentro de níveis aceitáveis". Você verá corrupção em dispositivos de superaquecimento, e a umidade condensará em dispositivos muito frios. Isso raramente é uma preocupação em um local de produção, onde muitas máquinas dependem dele, mas, ao selar o disco (intencionalmente ou não, por exemplo, por meio de poeira), você verá superaquecimento.

SF.
fonte
2
Você pode usar extensores KVM e extensores USB para afastar as máquinas das fontes de calor / vibração / contaminação, incluindo o outro lado da parede.
Chris H
@ ChrisH: Nunca fiz isso, mas deve funcionar. Em nossos casos, o controlador incorporado mínimo em uma caixa hermeticamente fechada fica ao lado de máquinas pesadas no fundo da mina, fornecendo um pequeno console para controle imediato usando um teclado de membrana estanque instalado na face da caixa, enquanto um PC para todos os operações e monitoramento estão em um centro de controle a vários quilômetros de distância. Há um switch Ethernet com soquetes sobressalentes nessa caixa; portanto, se você precisar de controle no local por qualquer motivo, poderá levar um laptop. Mas isso é apenas para manutenção, não para uso regular.
SF.
Eu executei o USB sobre CAT5 (extensor proprietário) para teclado, mouse e uma webcam e VGA sobre outro CAT5 (outra caixa proprietária) por 100m para permitir que um sistema (um espectrômetro acoplado a fibra) seja controlado a partir de dois locais. Funcionou muito bem. Em distâncias mais longas, a Ethernet real funcionaria, ou melhor ainda, fazer tudo em fibra e opto-isolar ao mesmo tempo. Comms para a maquinaria real pode ser um problema embora
Chris H
2
A Tibbo fabrica dispositivos de ponte "RS232 sobre TCP / IP". Eles são um pouco incômodos, mas existem redes de controladores de semáforos em toda a cidade que dependem disso; "centro de comando" executando uma ponte de software (dezenas de portas virtuais RS232 em um PC) e os controladores de toda a cidade, conectados à fibra, controlados através das pequenas caixas de ponte. Abordagem terrivelmente antiquada, se você me perguntar, mas funciona, e esses não são casos herméticos. Portanto, se a máquina for controlada por RS232 / 485, você poderá usar esse tipo de dispositivo.
SF.
3

A vida útil estimada é fornecida pelo fabricante geralmente como "MTBF = 2000hrs", mas em "condições normais" - o que você descreve não é normal.

Por que as unidades SSD estão falhando - danos físicos ou conexões ruins.

Uma montagem anti-choque usada no passado era um banho de mercúrio, mas você provavelmente não poderá! Mas você poderia fazer uma versão em banho de óleo ...

Solar Mike
fonte
Meu pensamento é que o choque causado pela tarefa é bastante difícil, de modo que a montagem antic choque comum não ajudará. Como posso fazer a versão do banho de óleo? Acredite em mim, quando eu pesquisei anti-choque em banho de óleo, o Google me fornece imagens tolas. Agora estou sendo burro.
adadion
Uma bandeja retangular segurando o óleo (de profundidade suficiente) e uma bandeja menor flutuando na superfície segurando a unidade de disco - têm um laço no cabo para absorver o movimento. Pequenas molas macias para impedir que a bandeja flutuante toque nas laterais - as molas da caneta ou biro podem ser boas. Escolha o óleo para que não fique muito viscoso.
Solar Mike
1
Para a segunda versão você pode considerar uma tampa ... boa sorte
Solar Mike
1
@adadion Se você não possui um sensor / medidor de vibração, existem alguns aplicativos para smartphone que dão uma idéia - a precisão pode ser um problema, mas pode ser suficiente para comparação.
Solar Mike
1
@adadion: Se você estiver disposto a experimentar, tente algo como esta instalação de montagem antivibração de disco rígido DIY . Ele foi projetado para impedir que a vibração da própria unidade chegue ao gabinete, mas deve funcionar da mesma maneira nos dois sentidos. Obviamente, isso pode não ajudar muito contra choques de baixa frequência e alta amplitude (como o que você pode experimentar dirigindo rápido em uma estrada esburacada) que pode fazer com que a unidade bata contra o suporte de montagem, mas se você estiver tendo muitos desses , você tem problemas maiores de qualquer maneira.
Ilmari Karonen
3

Realmente um comentário, mas muito longo:

Eu lidei com PCs no chão de fábrica (marcenaria), eles se mostraram bastante resistentes.

Nossa configuração inicial era basicamente livre de problemas: montamos os PCs dentro de um gabinete; a frente era de ripas de plástico transparente (pense no que às vezes você vê em um freezer). A intenção original era manter uma leve pressão positiva com ar limpo, mas isso nunca foi feito e provou não ser necessário.

Infelizmente, depois disso, muitas máquinas foram instaladas com menos cuidado. O modo "falha" usual era o desligamento térmico, retire a tampa e sopre-a, funcionaria bem, embora isso se provasse mais problemático, pois a poeira causava algum dano.

Os principais problemas, no entanto, vieram de seus fios. Especificamos cabos blindados, mas a administração nos custou pouco, o prédio era conectado com fios de rede comuns e as modificações posteriores eram feitas com freqüência por eletricistas e não por pessoal de informática. Isso causou muita interferência e provavelmente foi responsável pela alta taxa de falhas das placas de rede. (Realmente, agora, um Cat-5 lançou mais de 480V, 400? Um barramento de força principal ??? Ou ainda mais extrema, uma conexão Y em um gato 5 - que realmente funcionou, embora com problemas de erro de rede!) t coloque um computador no mesmo circuito que um motor pesado. Não passe fios de computador paralelos a fios de alta potência, mesmo que estejam em circuitos separados.

As máquinas iniciais estavam todas sem disco (atualmente não é uma opção) e, mesmo depois disso, tudo de importante era armazenado na rede; portanto, se uma máquina agisse, ela poderia ser trocada muito rapidamente - levaria mais tempo para transportar a nova máquina para a rede. estação do que colocá-la em funcionamento no lugar da problemática.

A melhor lição - não deixe que os eletricistas sejam apenas assistentes cuidadosamente vigiados ao conectar as coisas.

Loren Pechtel
fonte
2

Estamos assumindo que o problema é causado por choque ou vibração. Pode haver várias outras causas, como temperatura, umidade, corrosão, produtos químicos, conforme apontado por outras pessoas.

Uma outra abordagem seria levar as unidades para um local não hostil e estender a conexão com cabos. Pode ser necessário que seus computadores sejam executados a partir de unidades externas.

Se você não conseguir levar os discos externos para longe, ainda poderá colocá-los em uma almofada (esponja como material) para evitar choques.

Se você ainda não conseguir escapar da vibração ou do choque, investigue a alteração de seus computadores por outros difíceis. Provavelmente, isso custará à sua empresa alguns dólares, mas provavelmente é melhor do que a interrupção da produção.

Gürkan Çetin
fonte
Como o OP disse que "reduzir o shake" mais parecia ter assumido o problema é devido à vibração ...
Solar Mike
1
Concorde que a vibração foi a principal / grande causa, no entanto, provavelmente a segunda causa já está em vigor. O que pode ser elétrico ou qualquer outro, como Jonathan sugere. Isolar os discos do PC também contornaria essa opção, pois a energia USB é mais calma que a placa principal?
Gürkan
Não seria muito arriscado colocar o caminho para fora da estação? O erro humano não pode ser evitado. :(
adadion
1
É uma questão de ergonomia, e se a fonte é a própria estação, e não o ambiente ao redor, esse caminho pode ser o caminho a seguir. Para erros humanos, você quer dizer cabos nas passarelas? Você também pode pensar em criá-los sem tocar na máquina. Também posso pensar em discos sem fio, o que provavelmente causaria várias outras preocupações. :)
Gürkan
2

Como outros disseram, os SSDs são resistentes a vibrações - não há partes móveis, ao contrário dos discos rígidos magnéticos.

Ambas as tecnologias são, no entanto, vulneráveis ​​aos campos eletromagnéticos, como outros também declararam. Fornecer proteção contra isso pode ajudar.

No entanto, você também não deve descontar outros fatores.

(Uma observação rápida: esta lista definitivamente não está completa. Basta examinar o escopo das outras respostas - dos níveis de tensão, ao calor e ao software - há MUITO que pode causar esses problemas. A menos que você tenha confiança na computação, convém contratar alguém para descobrir isso para você, porque eles podem estar olhando para diferentes fatores no local em que você não pensou. Dito isso, eis alguns fatores que você também deve considerar.)

  • Pode haver um problema com o cabo, e esses erros podem ser muito sutis, pois apenas aparecem esporadicamente. Teste os discos rígidos "defeituosos" em um ambiente normal em um PC diferente, com cabos diferentes - para garantir que eles realmente apresentem danos físicos.

  • Pode ser sua memória também. A menos que você esteja usando memória ECC, isso pode ser difícil de identificar. Se seus bits inverterem na memória, e isso acontecer apenas onde reside o seu programa, o sistema operacional ou seus drivers, todas as apostas serão desativadas. Pode não fazer nada, pode falhar ou pode simplesmente escrever lixo por todo o disco.

  • Pode não ser um problema de hardware. Um erro de software também pode corromper os dados. Ter uma pilha de drivers exótica pode tornar seu sistema mais propenso a dados corrompidos.

Dependendo da causa exata (você precisa determinar isso primeiro!), Podemos recomendar possíveis soluções. Existem muitas soluções - do isolamento ao RAID e aos sistemas de arquivos com soma de verificação, como o ZFS -, mas você precisa determinar a causa primeiro.

Aaa
fonte
2

Além das outras respostas: no ambiente mencionado, é possível que haja poeira metálica no ar. Quando isso entra no computador, você pode obter curtos elétricos. Uma caixa selada (ou ventilação com filtro de ar de alta qualidade) pode ajudar se for esse o caso.

Hobbes
fonte