Temos um RAID-6 de 16 unidades com três unidades problemáticas. Dois já estão mortos e o terceiro está dando avisos SMART. (Não importa como ficou em um estado tão ruim.)
Obviamente, queremos substituir as unidades mortas antes da que ainda está funcionando, mas é melhor:
substitua uma unidade morta, deixe o RAID reconstruir, depois substitua a outra e deixe reconstruir novamente; ou
substituir as duas unidades ao mesmo tempo e deixá-lo reconstruir os dois em paralelo?
Em outras palavras, voltaremos a um estado de redundância mais rápido ao reintroduzir uma unidade ou duas? A reconstrução de duas unidades em paralelo atrasa o processo de reconstrução?
Caso isso importe, o controlador é um 3ware 9650SE-16ML.
raid
hard-drive
3ware
replace
Warren Young
fonte
fonte
Respostas:
!!!!! 1 !!!!!
Faça um de cada vez, sério, não pense em fazer QUALQUER outra maneira, ok.
Qualquer outra coisa testará suas habilidades completas de restauração do sistema.
fonte
Você tem bons backups recentes? Se não, você acha que pode obtê-los em tempo razoável?
Honestamente, eu ficaria mais preocupado em desativar a unidade defeituosa offline durante uma reconstrução do que qualquer outra coisa - se você já está lançando erros SMART, está na metade do caminho.
Minha sugestão seria confirmar seus backups e, em seguida, reconstruir uma unidade de cada vez para tentar recuperar para um estado em que você possa substituir a que está lançando erros SMART (unidades mortas primeiro, soft-erros por último).
Se você não tiver backups, é uma porcaria: o backup pode criar erros simples o suficiente para marcar a unidade marginal como falhada, assim como tentar fazer uma reconstrução.
fonte
Não vejo sentido em alterá-lo como "um disco por vez".
Obviamente, se o RAID for capaz de "resilver" os dois discos simultaneamente ( que falharam de qualquer maneira ), você só ganhará, permitindo que todo o RAID recupere sua capacidade de suportar até 2 falhas mais rapidamente .
fonte
Meus 0,02. $
Como o servidor já está offline, execute o ddrescue na unidade que está prestes a falhar, para cloná-lo em outra unidade sã.
Em seguida, coloque a nova unidade sã na matriz. Se a clonagem for bem-sucedida, você evitará o risco de ver a unidade falhar durante duas reconstruções.
fonte