Matriz inteligente HP; Como remover com segurança uma unidade física com falha preditiva SMART da matriz para que ela possa ser substituída?

9

slot do controlador hpacucli = 1 ld 1 show detail

Smart Array P400 in Slot 1

   array A

      Logical Drive: 1
         Size: 273.3 GB
         Fault Tolerance: RAID 1+0
         Heads: 255
         Sectors Per Track: 32
         Cylinders: 65535
         Stripe Size: 128 KB
         Status: OK
         Array Accelerator: Enabled
         Unique Identifier: xxxx
         Disk Name: /dev/cciss/c0d0
         Mount Points: /boot 196 MB, / 7.8 GB
         Logical Drive Label: xxxxx
         Mirror Group 0:
            physicaldrive 1I:1:8 (port 1I:box 1:bay 8, SAS, 72 GB, Predictive Failure)
            physicaldrive 1I:1:7 (port 1I:box 1:bay 7, SAS, 72 GB, OK)
            physicaldrive 1I:1:6 (port 1I:box 1:bay 6, SAS, 72 GB, OK)
            physicaldrive 1I:1:5 (port 1I:box 1:bay 5, SAS, 72 GB, OK)
         Mirror Group 1:
            physicaldrive 2I:1:4 (port 2I:box 1:bay 4, SAS, 72 GB, OK)
            physicaldrive 2I:1:3 (port 2I:box 1:bay 3, SAS, 72 GB, OK)
            physicaldrive 2I:1:2 (port 2I:box 1:bay 2, SAS, 72 GB, OK)
            physicaldrive 2I:1:1 (port 2I:box 1:bay 1, SAS, 72 GB, OK)

slot do controlador hpacucli = 1 show

Smart Array P400 in Slot 1
   Bus Interface: PCI
   Slot: 1
   Serial Number: xxxx
   Cache Serial Number: xxxx
   RAID 6 (ADG) Status: Disabled
   Controller Status: OK
   Chassis Slot:
   Hardware Revision: Rev D
   Firmware Version: 4.06
   Rebuild Priority: Medium
   Expand Priority: Medium
   Surface Scan Delay: 15 secs
   Post Prompt Timeout: 0 secs
   Cache Board Present: True
   Cache Status: OK
   Accelerator Ratio: 100% Read / 0% Write
   Drive Write Cache: Disabled
   Total Cache Size: 256 MB
   Battery Pack Count: 0
   SATA NCQ Supported: True

É seguro executar esta sequência de comandos?

hpacucli controller slot=1 array A remove drives=1:8
hpacucli controller slot=1 pd 1:8 modify led=on

obtenha mãos remotas para remover a unidade e substituí-la. Então corra:

hpacucli controller slot=1 array A add drives=1:8

Isso fará com que a matriz seja reconstruída com segurança?

gilesw
fonte

Respostas:

7

É seguro executar esses comandos. O grupo de espelhos pode sobreviver à ausência de um disco. Ele deve ser reconstruído automaticamente, mas se isso não acontecer, o comando que você já identificou irá ativá-lo.

sysadmin1138
fonte
Isso é baseado na experiência com os servidores HP? Sou a favor da sua solução simplesmente porque, se um disco estiver sendo gravado quando fisicamente removido de uma matriz, as cabeças do disco estarão no plater e poderão causar danos ao próprio disco. Prefiro que a unidade esteja fora da faixa e girada. Espero que seja o que os comandos devem fazer.
gilesw
2
@ User70139 Os cartões SmartArray são inteligentes o suficiente para parar de gravar em um disco que está em pré-falha e iniciar o piscar da luz de falha. A E / S já foi desativada pelo cartão. O drive ainda está girando, mas as cabeças não estão sendo usadas. Se você estiver preocupado, ao retirar a unidade antiga, puxe-a uma polegada e aguarde 10 segundos antes de retirá-la completamente.
sysadmin1138
2
Desde que os discos da HP tenham alças vermelhas, eles são compatíveis com troca a quente e podem ser extraídos do servidor a qualquer momento, mesmo quando estão girando. Obviamente, você não quer agitá-lo até que ele tenha 10 a 15 segundos para parar os pratos girando. Na verdade, não os brigue sempre e você deve ficar bem. A reconstrução / substituição da unidade é de responsabilidade do controlador e você não precisa se preocupar em executar nenhum comando antes ou depois de puxar uma unidade com falha. Tudo está acontecendo mais abaixo na pilha.
Chris Thorpe
10

Você pode simplesmente puxar o disco morto e substituí-lo - não há necessidade de envolvimento do SO.

Chopper3
fonte
5

Uma unidade com pré-falha não terá necessariamente um indicador LED (às vezes é um piscar âmbar lento), portanto, identificá-lo para mãos inteligentes é uma boa idéia. Você não precisa remover a unidade da matriz ou adicioná-la novamente. Essas funções serão tratadas pelo controlador automaticamente. Tudo que você precisa é a hpacucli controller slot=1 pd 1:8 modify led=onlinha.

ewwhite
fonte
1

A sequência de comandos que você especifica não funciona em nossos controladores Smart Array 641/642. Um This operation is not supported with the current configurationerro é encontro. Na minha classe de matriz, esses comandos não funcionam, mesmo que todos os discos estejam funcionando corretamente. A melhor solução é o processo de ewwhite para piscar a unidade e substituir fisicamente.

SteveM
fonte