RAID ressincronizando automaticamente?

11

Eu verifiquei aleatoriamente o status das minhas matrizes RAID cat/proc/mdstate percebi que uma das minhas matrizes parece estar ressincronizando:

md1 : active raid1 sdb7[1] sdc7[0]
      238340224 blocks [2/2] [UU]
      [==========>..........]  resync = 52.2% (124602368/238340224) finish=75.0min speed=25258K/sec

Por que isso e o que isso significa? Eu aparentemente posso acessar o ponto de montagem muito bem com r/wpermissões.

EDIT 1 (em resposta à RESPOSTA do SLM )

Eu realmente não consigo ver nada se eu greppassar dmesge o --detailswitch também não me diz muito, ou seja, mostra que a ressincronização está em andamento ... mas nenhuma dica do motivo ou por que pode ter saído de sincronia .. - Acho que preciso ficar de olho nele antes de começar a trocar meu hardware.

stdcerr
fonte

Respostas:

10

Isso parece indicar que a sincronização entre os 2 membros do RAID não está sincronizada.

1. Investigue logs

Eu investigaria seus dmesglogs e veria se há alguma mensagem informando que qualquer um dos HDDs físicos que compõem essa matriz está com falhas de hardware.

2. Verifique mdadm

Você também pode consultar mdadmusando o --detailswitch para descobrir mais informações sobre a ressincronização, como:

$ sudo mdadm --detail /dev/md0
/dev/md0:
        Version : 00.90.03
  Creation Time : Sat Jan 26 09:14:11 2008
     Raid Level : raid1
     Array Size : 976759936 (931.51 GiB 1000.20 GB)
  Used Dev Size : 976759936 (931.51 GiB 1000.20 GB)
   Raid Devices : 2
  Total Devices : 2
Preferred Minor : 0
    Persistence : Superblock is persistent

    Update Time : Fri Jan  1 01:29:16 2010
          State : clean, resyncing
 Active Devices : 2
Working Devices : 2
 Failed Devices : 0
  Spare Devices : 0

 Rebuild Status : 50% complete

           UUID : 37a3bfcb:41393031:23c133e6:3b879f08
         Events : 0.2178969

    Number   Major   Minor   RaidDevice State
       0       8        1        0      active sync   /dev/sda1
       1       8       17        1      active sync   /dev/sdb1

Se ambos os dispositivos parecerem bons e você não conseguir identificar qual dispositivo está com problema, execute temporariamente uma ferramenta de diagnóstico como HDAT2 ou SpinRite em cada HDD para confirmar sua saúde.

3. Cabeamento

Se os HDDs fizerem check-out, eu começaria a examinar o cabeamento, normalmente os trocarei.

4. Controlador

Em seguida, examinaria o próprio controlador, removendo as unidades do sistema afetado e diagnosticando-as em um sistema secundário ou adicionando uma placa controladora de terceiros ao sistema afetado para diagnosticar ainda mais o problema.

5. Fonte de alimentação

Acredite ou não, eu tive problemas no passado com HDDs e RAIDs em que trocar uma fonte de alimentação com falha ou prestes a falhar resolveu meus problemas de saúde com RAID.

slm
fonte
@cerr - sim, se as ressincronizações continuarem acontecendo em intervalos aleatórios, é provável que um dos HDs esteja saindo, ou 3,4 ou 5. A manifestação que você está descrevendo algumas vezes e foram as situações que resolveram essas falhas, para mim, no passado.
slm
8

Verifique seus arquivos cron, muitas distros realizam uma ressincronização / verificação novamente uma vez por semana.

No CentOS 7.1, está em /etc/cron.d/raid-check

# Run system wide raid-check once a week on Sunday at 1am by default
0 1 * * Sun root /usr/sbin/raid-check

Para configurar o comportamento, edite / etc / sysconfig / raid-check

Sergio
fonte
Embora geralmente é apenas um cheque, e não um resync ...
frostschutz
2
@frostschutz ... a menos que seja o primeiro domingo de um mês: serverfault.com/a/255549/299551 Nesse caso, uma ressincronização é forçada.
Dan
2

No Debian, isso é feito a partir de:

/etc/cron.d/mdadm

Desabilitar:

chmod -x /usr/share/mdadm/checkarray

Veja também.

sanmai
fonte