Invasão do disco rígido 5

10

Eu tenho o servidor IBM x3650 M4. É configurado com o Raid 5 e inclui 4 discos rígidos SAS com capacidade de 500 GB cada. Agora, o disco rígido 2 está mostrando como ruim. Portanto, substituindo os 2 discos rígidos por um novo, os dados serão reconstruídos automaticamente ou preciso fazer outras alterações. Eu não sei muito sobre a configuração Raid, então por favor ajude.

Lakhan Vasre
fonte
3
Isto parece a propósito: serverfault.com/questions/2888/why-is-raid-not-a-backup
Andrew Henle
2
A matriz está atualmente online? Você pode acessá-lo? Além disso, quais são suas prioridades? Seu backup está atualizado? O tempo de inatividade é um problema?
David Schwartz
2
Como nota de rodapé, a reconstrução de discos rígidos RAID é uma operação muito estressante para HDs ... Há uma possibilidade muito distinta de outros discos rígidos morrerem durante a execução (todos eles têm a mesma idade, são do mesmo lote, se eles têm defeitos, todos têm o mesmo defeito) ... É provavelmente melhor tentar copiar todos os dados em outro lugar.
Xanatos
@ xanatos Como posso copiar todos os dados em outro lugar. você pode me dizer o mesmo?
Lakhan vasre
11
"Como posso copiar todos os dados em outro lugar." Isso seria o que chamamos de "backup". Você já está fazendo isso, certo? E você está testando regularmente que também pode restaurá-lo?
22817 Roger Lipscombe

Respostas:

19

Se você perder mais de um disco em um RAID 5, sua matriz foi danificada de forma irreparável. Na maioria dos casos, os dados são totalmente destruídos no seu caso, se você não é especialista em recuperação ou se não deseja enviá-los para um equipamento de recuperação. Se você deseja recuperar os dados dessa matriz, coloque-os off-line imediatamente e recupere-os por conta própria ou envie a matriz + o cartão para alguém como o DriveSavers.

Esse é um dos motivos pelos quais geralmente é aconselhável ficar longe do RAID 5 e usar o RAID 6, 10 ou algum nível de RAID-Z ou unRAID.

Agora seria um ótimo momento para restaurar a partir do backup. Se você pretende criar uma nova matriz com novos discos, considere também atribuir o machado aos discos restantes se eles forem igualmente antigos.

Spooler
fonte
10
Eu diria que "geralmente aconselhado a ficar longe do RAID5" é falso. Como qualquer ferramenta ou tecnologia, você só precisa estar ciente de suas limitações. Duas falhas de disco no RAID1 ou RAID10 também podem causar o mesmo problema.
Mark Henderson
6
Ditto @MarkHenderson. O RAID 6 geralmente tem um custo de desempenho e certamente um custo de espaço de armazenamento; O RAID 10 tem um custo de espaço de armazenamento; e o RAID-Z1 não é mais resiliente contra falhas em vários discos do que o RAID 5, exceto na medida em que o ZFS é mais resiliente do que qualquer outra coisa que se possa usar, o que pode não ser de todo. Eu não sei sobre unRAID. Suspeito que o problema subjacente do OP não esteja monitorando a matriz quanto a problemas, mas que (nem o objetivo de ficar longe do RAID 5) não invalide a maior parte desta resposta: uma matriz RAID 5 com dois discos mortos nunca está funcionando. recuperar por conta própria.
um CVn 22/02
1
O conselho para evitar o RAID5 é válido para novas compilações, especialmente com unidades muito grandes. A principal preocupação com o RAID5 é que, durante o período de reconstrução, uma segunda falha na unidade pode ocorrer. Quanto maior o tempo de reconstrução, maior a chance de isso acontecer. As matrizes RAID5 mais antigas são feitas de unidades menores, portanto, o risco é menor.
churrasco
@ MichaelKjörling, como eu o entendo, o unRAID é basicamente o RAID 5 com faixas no nível do arquivo, em vez de faixas no nível do bloco. Sim, uma falha de dois discos significa que você perde a matriz, mas o padrão de armazenamento diferente significa que você pode recuperar tudo, exceto os arquivos que estavam nos discos com falha.
Mark
É verdade que os conselhos sobre o RAID 5 são direcionados principalmente para novas matrizes com discos grandes. Se o OP estiver com falhas de disco duplo em discos com anos de idade, é hora de adquirir novos - e o custo de novas unidades> = 1TB é geralmente o mesmo que uma unidade de 500G na maioria dos casos. É difícil dar uma resposta menos genérica quando não sei qual é a carga de trabalho / precisa ser.
Spooler
8

Então, só para esclarecer, você tinha uma matriz R5 de 4 discos, substituiu 2 discos de uma vez - está certo?

os dados serão reconstruídos automaticamente ou preciso fazer outras alterações

Se o que estou lendo que você fez estiver correto, então não, não, ele nunca será reconstruído e você destruiu seus dados e sim, você terá que fazer outras alterações para limpar o arquivo. matriz e restaure a partir do seu último backup.

Se eu interpretei mal sua pergunta, por favor, esclareça, caso contrário você se jogou.

Chopper3
fonte
1
Oi Chopper3 Ainda não fiz nada. Agora mesmo eu comprei o novo disco rígido, mas antes de conectá-lo ao servidor, eu queria perguntar a vocês. se devo conectar os discos rígidos ou tentar outras opções de recuperação ou algo mais precisa ser feito. Eu sou novo para isso, então eu não sou certo o que exatamente tem que ser feito
vasre Lakhan
5
Ah - boas notícias - nesse caso, o que você precisa fazer é substituir as duas unidades UMA POR VEZ, garantindo que a matriz seja totalmente reconstruída após a substituição da primeira unidade antes de substituir a segunda unidade. Uma vez feito isso e seu array R5 é 100% bom, você precisa formar um plano para migrar do R5 para algo mais estável, como R6 / 60 ou R10, ok.
Chopper3
3
@ Chopper3 Eu acho que o RAID-5 para uma matriz de 4 discos não precisa necessariamente ser substituído por RAID-6 ou RAID-10. O RAID-5 deve fornecer disponibilidade adequada (apesar da falha de duas unidades aqui ...), e nenhuma versão do RAID fornece backup adequado de qualquer maneira.
Andrew Henle
2
Daniel e Andrew - com discos de 4 x 500 GB, sim, eu posso ver como você ficaria feliz em continuar com o R5, mas como sabemos, é positivamente perigoso usar o R5 com discos de> 1 TB e foi a melhor parte de um década
Chopper3
5
@ Chopper3: Essa regra se aplica a implementações ingênuas de RAID5 e dados altamente valiosos. Um controlador RAID5 inteligente pode se recuperar de 2 discos com erros de leitura irrecuperáveis, se eles não coincidirem. E com discos de 1 TB, essa já é uma chance bastante baixa. (Você ainda está em apuros quando inteiras morre um disco, além de URE em outro disco, mas esse risco é bastante relacionado ao tamanho)
MSalters