Gostaria de saber como posso tornar a unidade de disco rígido mais durável? Especificamente, eu trabalho em um ambiente de fábrica. E quase todos os meses, a unidade de disco rígido em algumas máquinas da fábrica está corrompida e até não pode ser reparada. Já implementamos vários SSD em alguns deles, mas isso não ajuda muito. Eles também estão sendo corrompidos em máquinas de fábrica com tarefas pesadas.
Então, sempre que isso acontecia, sempre restaurávamos usando nossa imagem de backup. E já conectamos toda a unidade de disco rígido com amortecedor para reduzir a trepidação.
Existe alguma outra opção ou prevenção que possamos usar? Talvez adicionando algum material anti-ímã para evitar o atrito do ímã ou algo mais? E de que material precisamos?
Edit: Máquina de fábrica com tarefas pesadas, menciono acima basicamente máquina para criar carroçaria de metal e molde de estrutura de carro.
E quando eu quis dizer que o disco está corrompido, significa ilegível. O disco inteiro. Não são os arquivos do programa ou o software relacionados. Portanto, não será inicializado.
Respostas:
Muito provavelmente, o assassino SSD é elétrico. Não podemos descartar inteiramente a vibração mecânica, mas os SSDs são bastante robustos mecanicamente. Uma montagem simples de borracha aumentaria ainda mais a resiliência. Verifique também se os cabos de alimentação e de dados têm folga suficiente. A vibração pode fazer com que se soltem quando estão sob tensão.
Portanto, para lidar com a confiabilidade elétrica, precisamos considerar dois fatores. Em primeiro lugar, as máquinas pesadas podem extrair grandes correntes da fonte de alimentação. Isso pode causar quedas de tensão, o que, por sua vez, pode afetar negativamente o SSD. Isso é facilmente resolvido por um no-break online. Essencialmente, esse tipo de no-break alimenta o computador a partir de uma bateria, enquanto a energia principal é usada para carregar a bateria.
Um problema mais incomum pode ser a radiação eletromagnética. Máquinas de alta potência terão grandes correntes em funcionamento, geralmente a 50 ou 60 Hz. Involuntariamente, isso fará com que os cabos atuem como antenas. Os grandes cabos da máquina atuam como remetentes e os cabos do SSD podem atuar como receptores. A solução aqui é ter uma gaiola adequada de Faraday, idealmente aterrada. É por isso que as caixas de PC normais são feitas de metal; eles funcionam como gaiolas de Faraday, mantendo a radiação EM em faixas de frequência entre 50 Hz e vários Ghz.
fonte
Primeiro, problemas elétricos e magnéticos não são tão ruins quanto problemas de vibrações e contaminação do ar. A umidade do ar, além de poeira ou produtos químicos, pode corroer ou curvar caminhos com muita facilidade e, em nossas instalações, são os principais motivos de falhas se os dispositivos não estiverem protegidos adequadamente.
A melhor opção é manter tudo o que não é necessário no local de produção fora do local. Mantenha controladores embarcados minimalistas junto às máquinas, mantenha os PCs em um escritório limpo, comunicando-se com os controladores pela LAN.
Se isso não for possível, você precisará de caixas seladas. Possivelmente com elementos de transferência de calor, se necessário; caixas herméticas que mantêm a maior parte da umidade afastada, alguma sílica no interior para absorver o restante da umidade - nem a poeira seca nem a umidade do ar limpo são um grande problema, mas combinadas elas rapidamente levam à oxidação dos contatos, outros problemas relacionados à corrosão.
Na minha experiência, os distúrbios EM raramente são poderosos o suficiente para causar danos duradouros. Eles podem nocautear um dispositivo, forçando uma reinicialização, mas um dispositivo bem construído se recuperará disso. Os surtos de energia são uma questão diferente; sem uma boa proteção contra sobretensão, você poderá ver danos aleatórios nas peças.
Finalmente, vibração. A vibração conduzida pelo piso é facilmente reduzida a níveis desprezíveis através de um tapete de esponja ou similar. A vibração de uma máquina, caso o dispositivo esteja diretamente conectado à máquina ... há pouco a fazer sobre isso. Existem sistemas de amortecimento, mas eles só são eficientes contra certas escalas de vibração ... realmente, basta mover a caixa de controle a 2 metros de distância.
Além disso, a faixa de temperatura deve estar "dentro de níveis aceitáveis". Você verá corrupção em dispositivos de superaquecimento, e a umidade condensará em dispositivos muito frios. Isso raramente é uma preocupação em um local de produção, onde muitas máquinas dependem dele, mas, ao selar o disco (intencionalmente ou não, por exemplo, por meio de poeira), você verá superaquecimento.
fonte
A vida útil estimada é fornecida pelo fabricante geralmente como "MTBF = 2000hrs", mas em "condições normais" - o que você descreve não é normal.
Por que as unidades SSD estão falhando - danos físicos ou conexões ruins.
Uma montagem anti-choque usada no passado era um banho de mercúrio, mas você provavelmente não poderá! Mas você poderia fazer uma versão em banho de óleo ...
fonte
Realmente um comentário, mas muito longo:
Eu lidei com PCs no chão de fábrica (marcenaria), eles se mostraram bastante resistentes.
Nossa configuração inicial era basicamente livre de problemas: montamos os PCs dentro de um gabinete; a frente era de ripas de plástico transparente (pense no que às vezes você vê em um freezer). A intenção original era manter uma leve pressão positiva com ar limpo, mas isso nunca foi feito e provou não ser necessário.
Infelizmente, depois disso, muitas máquinas foram instaladas com menos cuidado. O modo "falha" usual era o desligamento térmico, retire a tampa e sopre-a, funcionaria bem, embora isso se provasse mais problemático, pois a poeira causava algum dano.
Os principais problemas, no entanto, vieram de seus fios. Especificamos cabos blindados, mas a administração nos custou pouco, o prédio era conectado com fios de rede comuns e as modificações posteriores eram feitas com freqüência por eletricistas e não por pessoal de informática. Isso causou muita interferência e provavelmente foi responsável pela alta taxa de falhas das placas de rede. (Realmente, agora, um Cat-5 lançou mais de 480V, 400? Um barramento de força principal ??? Ou ainda mais extrema, uma conexão Y em um gato 5 - que realmente funcionou, embora com problemas de erro de rede!) t coloque um computador no mesmo circuito que um motor pesado. Não passe fios de computador paralelos a fios de alta potência, mesmo que estejam em circuitos separados.
As máquinas iniciais estavam todas sem disco (atualmente não é uma opção) e, mesmo depois disso, tudo de importante era armazenado na rede; portanto, se uma máquina agisse, ela poderia ser trocada muito rapidamente - levaria mais tempo para transportar a nova máquina para a rede. estação do que colocá-la em funcionamento no lugar da problemática.
A melhor lição - não deixe que os eletricistas sejam apenas assistentes cuidadosamente vigiados ao conectar as coisas.
fonte
Estamos assumindo que o problema é causado por choque ou vibração. Pode haver várias outras causas, como temperatura, umidade, corrosão, produtos químicos, conforme apontado por outras pessoas.
Uma outra abordagem seria levar as unidades para um local não hostil e estender a conexão com cabos. Pode ser necessário que seus computadores sejam executados a partir de unidades externas.
Se você não conseguir levar os discos externos para longe, ainda poderá colocá-los em uma almofada (esponja como material) para evitar choques.
Se você ainda não conseguir escapar da vibração ou do choque, investigue a alteração de seus computadores por outros difíceis. Provavelmente, isso custará à sua empresa alguns dólares, mas provavelmente é melhor do que a interrupção da produção.
fonte
Como outros disseram, os SSDs são resistentes a vibrações - não há partes móveis, ao contrário dos discos rígidos magnéticos.
Ambas as tecnologias são, no entanto, vulneráveis aos campos eletromagnéticos, como outros também declararam. Fornecer proteção contra isso pode ajudar.
No entanto, você também não deve descontar outros fatores.
(Uma observação rápida: esta lista definitivamente não está completa. Basta examinar o escopo das outras respostas - dos níveis de tensão, ao calor e ao software - há MUITO que pode causar esses problemas. A menos que você tenha confiança na computação, convém contratar alguém para descobrir isso para você, porque eles podem estar olhando para diferentes fatores no local em que você não pensou. Dito isso, eis alguns fatores que você também deve considerar.)
Pode haver um problema com o cabo, e esses erros podem ser muito sutis, pois apenas aparecem esporadicamente. Teste os discos rígidos "defeituosos" em um ambiente normal em um PC diferente, com cabos diferentes - para garantir que eles realmente apresentem danos físicos.
Pode ser sua memória também. A menos que você esteja usando memória ECC, isso pode ser difícil de identificar. Se seus bits inverterem na memória, e isso acontecer apenas onde reside o seu programa, o sistema operacional ou seus drivers, todas as apostas serão desativadas. Pode não fazer nada, pode falhar ou pode simplesmente escrever lixo por todo o disco.
Pode não ser um problema de hardware. Um erro de software também pode corromper os dados. Ter uma pilha de drivers exótica pode tornar seu sistema mais propenso a dados corrompidos.
Dependendo da causa exata (você precisa determinar isso primeiro!), Podemos recomendar possíveis soluções. Existem muitas soluções - do isolamento ao RAID e aos sistemas de arquivos com soma de verificação, como o ZFS -, mas você precisa determinar a causa primeiro.
fonte
Além das outras respostas: no ambiente mencionado, é possível que haja poeira metálica no ar. Quando isso entra no computador, você pode obter curtos elétricos. Uma caixa selada (ou ventilação com filtro de ar de alta qualidade) pode ajudar se for esse o caso.
fonte