Estou configurando uma matriz RAID1 de dois novos discos rígidos de 4 TB.
Ouvi em algum lugar anteriormente que a criação de uma matriz RAID1 de novos discos rígidos idênticos comprados ao mesmo tempo aumentava a chance de que falhassem em um ponto semelhante no tempo.
Portanto, estou pensando em usar um dos discos rígidos por um período de tempo (talvez algumas semanas) por conta própria, em uma tentativa de reduzir a probabilidade de ambos falharem em um curto período de tempo. (a unidade não utilizada seria mantida desconectada em uma gaveta)
Parece uma abordagem razoável, ou provavelmente estou apenas perdendo meu tempo?
raid
hardware-raid
raid1
drive-failure
a_henderson
fonte
fonte
Respostas:
É uma perda de tempo.
Você não poderá induzir falhas ou forçar as unidades de maneira significativa. Você tem RAID, e esse é um bom começo. Apenas verifique se você possui um monitoramento para realmente detectar falhas à medida que ocorrem e backups para proteger contra desastres.
fonte
Talvez seja melhor usar marcas diferentes ou séries de disco juntas, se você estiver preocupado com isso.
Eu ter visto discos de tipo e idade similar falha em clusters, então IMHO não é uma Leend urbana.
fonte
Ótima pergunta - No entanto, ao contrário dos faróis de automóveis, isso é uma perda de tempo. A classificação MTBF [tempo médio entre falhas] para unidades de 4 GB [WD Red neste exemplo] é de 1.000.000 horas. As chances de duas unidades ficarem ruins no espelho ao mesmo tempo são extremamente raras. Quando eu vi isso acontecer, foi porque a primeira unidade falhou sem que ninguém percebesse. Mais útil proteger com backups do que incomodar a queima de uma unidade primeiro. Se você misturar tipos de unidades, verifique se as unidades têm a mesma velocidade. Se você é paranóico, o RAID 10 é para você.
fonte
Embora faça sentido na teoria, os dados não suportam a necessidade de
work in
sua unidade.Não apenas algumas semanas realmente não causam impacto, como as porcentagens de falha não funcionam quando se olha apenas para duas unidades.
Embora tenha havido alguma indicação de taxas de falha mais normalizadas quando se trata de unidades do mesmo modelo.
Como tal, falhas relacionadas à idade, que são apenas um pequeno subconjunto de falhas, podem ser um pouco correlacionadas para gerar safras. Mas a maioria das falhas não pode.
Se você adicionar a isso as porcentagens gerais de falhas, que podem atingir 8% em um determinado ano, as chances de ambas as unidades falharem no mesmo ano são pequenas, e as falhas na mesma semana serão insignificantes.
E isso é se você observar todas as causas possíveis de falha, não apenas as falhas relacionadas à idade.
Se você deseja minimizar o risco, mas duas unidades de um vintage diferente.
Se você quiser garantias, compre um seguro.
E, como a resposta da ewwhite já afirmou, backups e monitoramento são uma obrigação.
fonte
Isso geralmente é um argumento para SSDs mais do que HDDs na minha experiência. Os SSDs têm ciclos de gravação limitados; portanto, se você usar um RAID1 com dois SSDs do mesmo modelo, os dois deverão ficar sem ciclos de gravação quase ao mesmo tempo.
Quanto a falhas gerais, a menos que você tenha um problema sério, como vibração em massa, estática ou calor elevado; Eu não suspeito que você verá duas de duas unidades falharem ao mesmo tempo.
Uma das principais preocupações do RAID1 (e RAID10) com unidades maiores, como 4 TB, é a reconstrução. Com um espelho de 2 unidades, quando uma unidade falha, a outra unidade carrega duas vezes a carga de trabalho. Então, quando você reconstrói, essa unidade está recebendo ainda mais carga. Se houver algo errado com essa unidade, é provável que falhe nessas condições, especialmente considerando que a reconstrução de um espelho de 4 TB sob carga pode demorar muito tempo.
fonte
Você pode fazer, mas não vai ajudar muito.
Por exemplo, se houver uma agulha na energia de entrada, a mesma agulha matará os dois discos.
O que é importante: você precisa ter um bom backup. O ataque não compensa um bom backup. Na verdade, se você tiver um bom backup, talvez não seja necessário um ataque de espelhamento (se você puder tolerar o colapso do sistema entre 2 e 3 anos).
fonte