Monitoramento de disco / RAID para servidores HP Proliant e Ubuntu 12.04

10

Como posso monitorar o status dos discos rígidos e dos RAIDs de um servidor HP Proliant usando o Ubuntu 12.04. No Ubuntu 10.04, eu poderia usar o cciss-vol-status para consultar o status do RAID periodicamente, mas o cciss-vol0-status não funciona mais no 12.04. Na versão 12.04, não existem diretórios / proc / driver / cciss ou / dev / cciss.

Desenhou
fonte
Eu tenho uma instalação básica do Ubuntu 12.04 em um Proliant DL185 G4 e ele possui / dev / cciss e / proc / driver / cciss. O que lspci diz que você possui para um controlador RAID?
longneck

Respostas:

10

Grrr ... Ubuntu. :)

Que tipo de servidor HP ProLiant é esse? (modelo e geração, por favor)

O seu dispositivo de acionamento varia dependendo do seu controlador Smart Array. Com a mudança dos servidores G5 para G6, o driver do controlador RAID HP mudou do driver CCISS herdado para o novo driver HPSA . Com o driver mais recente, você não verá o driver de bloco CCISS ... Os dispositivos serão /dev/sdX.

Independentemente disso, sua chave para monitorar os controladores Smart Array RAID é instalar os HP Management Agents. No mínimo, você desejará o hpacucliutilitário de linha de comando. Ubuntu e Debian sempre tiveram menos suporte oficial da HP do que o Red Hat / SuSE. No entanto, existe um Debian ProLiant Support Pack que inclui agentes e ferramentas para sistemas Ubuntu / dpkg.

Essa é uma abordagem mais abrangente que pode gerar traps SNMP e alertas de email bacanas. Para obter apenas o software de configuração e gerenciamento RAID, puxe o hpacucliutilitário para baixo do repositório da HP .

Pode ser necessário também apt-get install lib32gcc1 lib32stdc++6 libc6-i386atender aos pré-requisitos de 32 bits.

A partir daí, você pode usar alguns hpacuclicomandos comuns para obter o status RAID. Um exemplo fácil:

[root@Woot ~]# hpacucli ctrl all show config       

Smart Array P410i in Slot 0 (Embedded)    (sn: 500143801664FE50)

   array A (SAS, Unused Space: 0  MB)


      logicaldrive 1 (279.4 GB, RAID 1, OK)

      physicaldrive 1I:1:1 (port 1I:box 1:bay 1, SAS, 300 GB, OK)
      physicaldrive 2I:1:5 (port 2I:box 1:bay 5, SAS, 300 GB, OK)

   array B (Solid State SATA, Unused Space: 0  MB)


      logicaldrive 2 (447.1 GB, RAID 1+0, OK)

      physicaldrive 1I:1:3 (port 1I:box 1:bay 3, Solid State SATA, 240.0 GB, OK)
      physicaldrive 1I:1:4 (port 1I:box 1:bay 4, Solid State SATA, 240.0 GB, OK)
      physicaldrive 2I:1:7 (port 2I:box 1:bay 7, Solid State SATA, 240.0 GB, OK)
      physicaldrive 2I:1:8 (port 2I:box 1:bay 8, Solid State SATA, 240.0 GB, OK)

   SEP (Vendor ID PMCSIERA, Model  SRC 8x6G) 250 (WWID: 500143801664FE5F)
ewwhite
fonte
Obrigado Edmund. O servidor é o HP Proliant DL360 G7 e você está certo, os dispositivos RAID estão em / dev / sdX.
Drew
2
Apenas outra observação, parece que eles renomearam o Proliant Support Pack para Management Component Pack para 12.04. communitylinux.org/node/446#comment-866
Drew
3

Os passos a seguir são o que eu fiz para fazê-lo funcionar no Ubuntu 16.04.

echo 'deb http://downloads.linux.hpe.com/SDR/repo/mcp xenial/current non-free' > /etc/apt/sources.list.d/hp.list
apt-get update
apt-get install hpacucli hp-health hponcfg hp-ams hp-snmp-agents hpmh hpsmh hpssaducli hpssa
user410516
fonte
2

Você também pode usar repositórios conforme escrito aqui: http://sysadmin.te.ua/linux/hpraid-monitoring.html

echo 'deb http://hwraid.le-vert.net/ubuntu precise main' > /etc/apt/sources.list.d/raid.list

Este repositório possui quase todos os utilitários de monitoramento de ataques para todos os tipos de ataques! Saudações.

Aleksandr
fonte
1

Parece que as coisas mudaram um pouco. A resposta do usuário410516 está aproximadamente no alvo, embora um pouco breve.

Os repositórios da Hewlett Packard Enterprise agora são gerenciados aqui . Para o Ubuntu 16.04, descobri que precisava do " Management Component Pack for ProLiant", descrito como "Software de agente para Ubuntu, Oracle e distros da comunidade". A HPE fornece o script add_repo.sh para adicionar seus repositórios à sua instalação.

$ ./add_repo.sh mcp
note : You must read and accept the License Agreement to continue.
Press enter to display it ...


 END USER LICENSE AGREEMENT
...

Este script não registrou as chaves da HPE, portanto, seguindo estas instruções:

curl http://downloads.linux.hpe.com/SDR/hpPublicKey1024.pub | apt-key add -
curl http://downloads.linux.hpe.com/SDR/hpPublicKey2048.pub | apt-key add -
curl http://downloads.linux.hpe.com/SDR/hpPublicKey2048_key1.pub | apt-key add -
curl http://downloads.linux.hpe.com/SDR/hpePublicKey2048_key1.pub | apt-key add -

A execução de um apt updatedos seguintes novos pacotes fica disponível.

  • cpqacuxe
  • hp-ams
  • saúde-hp
  • modelos de hp-smh
  • hp-snmp-agents
  • hpacucli
  • hponcfg
  • hpsmh
  • hpssa
  • hpssacli
  • hpssaducli

E nós podemos apt install hpssa hpacucli hpssacli hpssaducli.

$ hpacucli ctrl all show config

Smart Array P400 in Slot 0 (Embedded)     (sn: XXXXXXXXXXXXXX)

   array A (SAS, Unused Space: 0  MB)


      logicaldrive 1 (956.9 GB, RAID 5, Interim Recovery Mode)

      physicaldrive 1I:1:13 (port 1I:box 1:bay 13, SAS, 146 GB, OK)
      physicaldrive 1I:1:14 (port 1I:box 1:bay 14, SAS, 146 GB, OK)
      physicaldrive 1I:1:15 (port 1I:box 1:bay 15, SAS, 146 GB, Failed)
      physicaldrive 1I:1:16 (port 1I:box 1:bay 16, SAS, 146 GB, OK)
      physicaldrive 2I:1:9 (port 2I:box 1:bay 9, SAS, 146 GB, OK)
      physicaldrive 2I:1:10 (port 2I:box 1:bay 10, SAS, 146 GB, OK)
      physicaldrive 2I:1:11 (port 2I:box 1:bay 11, SAS, 146 GB, OK)
      physicaldrive 2I:1:12 (port 2I:box 1:bay 12, SAS, 146 GB, OK)


Smart Array P400 in Slot 1                (sn: XXXXXXXXXXXXXX)

   array A (SAS, Unused Space: 0  MB)


      logicaldrive 1 (136.7 GB, RAID 1+0, OK)

      physicaldrive 2I:1:1 (port 2I:box 1:bay 1, SAS, 72 GB, OK)
      physicaldrive 2I:1:2 (port 2I:box 1:bay 2, SAS, 72 GB, OK)
      physicaldrive 2I:1:3 (port 2I:box 1:bay 3, SAS, 300 GB, OK)
      physicaldrive 2I:1:4 (port 2I:box 1:bay 4, SAS, 300 GB, OK)

Podemos ver que há uma falha na unidade e podemos obter os detalhes para substituição por:

$ hpacucli ctrl slot=0 pd 1I:1:15 show detail

Smart Array P400 in Slot 0 (Embedded)

   array A

      physicaldrive 1I:1:15
         Port: 1I
         Box: 1
         Bay: 15
         Status: Failed
         Last Failure Reason: Hardware error
         Drive Type: Data Drive
         Interface Type: SAS
         Size: 146 GB
         Rotational Speed: 10000
         Firmware Revision: HPDC
         Serial Number: XXXXXXXXXXXXXXXXXXXX
         Model: HP      XXXXXXXXXX
         PHY Count: 2
         PHY Transfer Rate: 3.0Gbps, Unknown
Samuel Harmer
fonte