Posso apenas remover um disco de uma matriz RAID 1 ao vivo?

8

Eu li a história sobre o gerente retirando um disco de uma matriz RAID 5 e, em seguida, uma segunda, mas gostaria de experimentar o que acontece quando simplesmente desconecto um disco de um sistema ativo. É um servidor da série HP ProLiant DL585 G7 , portanto deve ser hot-swap.

Mas antes de começar, pensei que seria melhor receber alguma opinião de pessoas mais experientes antes de fazer qualquer coisa muito, muito boba.

Berzemus
fonte
Puxa, obrigado a todos pelas respostas rápidas .. Eu estou indo para ele ^ - ^
Berzemus
Estive lá, fiz isso! É realmente libertador, estou feliz por ter feito isso, obrigado a todos. (Agora eu só tenho que encontrar alguém para mostrá-lo a ..)
Berzemus
2
Apenas certifique-se de que a matriz tenha se espelhado completamente antes de mostrar alguém (ou certifique-se de puxar a mesma unidade que você fez desta vez). É bom confirmar que os kits funcionam e protegem você do jeito que afirma, não é ?!
David Spillett

Respostas:

22

Depende do seu controlador.

Se ele suporta hot-swap, então sim. Caso contrário, você pode explodir o controlador e matar toda a matriz.

Se você retirar uma unidade da matriz (enquanto estiver em execução ou desligada), você terá uma reconstrução completa a ser executada quando a colocar novamente, o que levará um tempo e degradará o desempenho enquanto isso ocorrer.

Testar a configuração do RAID dessa maneira não é uma má idéia. Apenas verifique se seus backups estão corretos e atualizados primeiro, caso algo dê errado e a matriz não sobreviva ao teste.

David Spillett
fonte
11
+1 no comentário sobre como ter um backup atualizado. ;-)
KPWINC
2
E certifique-se de que você também pode restaurar a partir do backup.
jay_dubya
Os backups devem ser considerados inválidos até que sejam restaurados com êxito uma vez em uma máquina de teste. E mesmo assim todos devem ser vistos com muita suspeita.
Mark Allen
8

Bem, de acordo com uma pesquisa simples, o servidor deve ter unidades "Hot-plug 2.5" SAS ", por isso, nesse caso, sim, você poderá extrair unidades e instalá-las enquanto a máquina estiver ativa. para verificar sua configuração real.

Isso é algo que você deve fazer não apenas para impressionar seu chefe, mas, mais importante, para demonstrar a si mesmo como ele funciona. Você desejará acionar uma unidade para garantir que o sistema permaneça ativo e para que sua reposição quente entre imediatamente. Também é uma boa ideia acompanhar o processo de reconstrução e observar quanto tempo leva. Substitua a unidade "ausente" por uma unidade diferente e verifique se é possível criar e atribuí-la como hot spare. Em seguida, puxe a outra unidade que fazia parte da matriz original e verifique se a máquina permanece ativa e se a nova reposição quente entra em ação.

Outro teste divertido é remover as unidades com a energia desligada e colocá-las novamente em uma ordem diferente, depois ligue a máquina e veja o que o controlador diz.

É importante fazer essas coisas antes que a máquina esteja em produção para que você a) saiba que realmente funciona eb) possa escrever um procedimento. Você pode se surpreender com a frequência com que uma determinada configuração RAID simplesmente não funciona conforme o esperado.

Como você é novato nisso, também poderá ver a aparência de uma unidade puxada se a conectar a outra máquina e tentar obter os dados. Você também pode experimentar unidades de tamanhos diferentes para entender como o sistema lida com elas.

Pode me chamar de paranóico, mas, idealmente, você também pode considerar comprar algumas réplicas extras de qualquer unidade que usará e testar cada uma delas antes que o sistema esteja em produção. Eu tive muitos problemas estúpidos com pequenas diferenças de tamanho de unidade entre fabricantes, unidades defeituosas que removeram canais SCSI inteiros quando inseridas etc. A vida é boa se você tiver algumas unidades sobressalentes idênticas às unidades que você usando.

Boden
fonte
+1 para reorganizar os discos. Alguns controladores têm um ataque cardíaco nisso, mas os melhores apenas reorganizam sua ordem em sua configuração.
Mark Henderson
11
Eu gostaria de poder +2 na verdade, para o seu segundo comentário sobre a compra de discos idênticos. Eu tinha um disco que era 1,2mb menor que o disco que estava substituindo (eram discos de 500 gb) e, como resultado, foi inútil.
Mark Henderson
4

Sim, se eles são hot swappable, basta puxar um disco e as coisas devem continuar funcionando. É assim que você substitui um disco com falha.

railmeat
fonte
1

Dependendo do controlador e / ou software, ele deve funcionar e, em muitos casos, a redundância seria recriada alguns momentos após a inserção do disco.

Eu nunca faria isso em um sistema de produção, porque é uma carga pesada nos discos, pode levar horas para espelhar os discos novamente (durante esse período você não tem redundância) e e and, mas, em teoria, deveria funcionar.

Nos sistemas de teste, eu sempre faço isso antes de entrar no ar e sempre restaurou ...

Sven
fonte
1

Temos alguns servidores antigos da Dell limpando um data center adquirido. Um deles tem um raid5 configurado, no momento em que ainda não o tínhamos em nosso escritório. Então fiz a única coisa lógica. Inicializei, iniciei alguns processos e comecei a puxar discos rígidos para a ciência. 1 estava bem, 2 estava bem, 3 não muito. Portanto, a resposta curta é sim. É libertador!

Skaughty
fonte
Se você conseguiu dois discos antes de falhar, isso soa como RAID-6 para mim. Mas sim, a primeira coisa que fiz quando coloquei minhas mãos na minha primeira matriz de 14 discos foi puxar uma para fora!
Mark Henderson
Muito agradável!!!!!!!!!
Kyle Hodgson
1

Tirei uma unidade de uma matriz RAID5 uma vez como uma prova ao vivo de teste de conceito / hardware enquanto eu estava na instalação da máquina. Eu já havia feito isso várias vezes no escritório, o que sempre foi bom, então presumi que seria dessa vez também. Ele voltou, mas demorou duas semanas para eu ser reconhecido novamente ... então, se você está pensando "vai ficar tudo bem!", Bem, deve ser sim. Mas ouça todas as histórias de advertência.

Kyle Hodgson
fonte
0

Sim, eu fiz (puramente por acidente, apressei-me a acrescentar).

Maximus Minimus
fonte