Como adicionar novamente o disco rígido removido acidentalmente no RAID5

14

Eu tenho um NAS no Ubuntu Server com 4 discos rígidos de 2 TB no RAID 5. Algumas semanas atrás, um dos discos rígidos morreu, mas meu RAID estava funcionando, apesar de degradado. Felizmente, ainda estava na garantia e recebi um novo disco rígido que instalei hoje. No entanto, ao tentar adicionar o novo disco rígido ao RAID, ele não estava sendo reconstruído. Então, desconectei o disco rígido e reinicializei a máquina. No entanto, acidentalmente configurei um dos meus OUTROS discos rígidos no RAID para falhar e o removi usando o mdadm.

Agora, ele diz que meu RAID possui dois discos rígidos removidos. Eu ainda tenho meu terceiro disco rígido com todos os meus dados ainda intactos, mas não sei como adicioná-lo novamente à matriz RAID; portanto, ele volta a um estado bom (embora degradado), para que eu possa continuar adicionando o quarto disco rígido e reconstrua a matriz. É possível fazer o Ubuntu perceber que o terceiro disco rígido possui meus dados e apenas reconhecê-los como parte da matriz novamente?

Quando tento executar:

sudo mdadm --manage /dev/md127 --re-add /dev/sdd1 

Diz:

mdadm: --re-add for /dev/sdd1 to dev/md127 is not possible

Por favor, qualquer ajuda que alguém possa dar seria muito, muito apreciada.

Chunky56
fonte
1
Acho que consegui recuperá-lo para um estado degradado. Consegui usar o comando mdadm --assemble --force na documentação e acredito que ele voltou a uma situação em que pelo menos 3 das 4 unidades estão funcionando. Para qualquer pessoa no futuro que se depare com esse problema, este é o comando que eu usei (supondo que as três unidades de trabalho sejam sdb, sdc, sdd, cada uma com partições únicas de sdb1, sdc1, sdd1: Código: sudo mdadm --assemble - força / dev / md127 / dev / sdb1 / dev / sdc1 / dev / sdd1 (sudo pode não ser necessário, dependendo da sua situação)
Chunky56

Respostas:

5

Você pode precisar apenas fazer um --adde não um --re-add. se você ler a página de manual sobre o --re-addassunto, fala sobre adicionar novamente o dispositivo se a contagem de eventos for próxima ao restante dos dispositivos. você pode usar --examinepara descobrir isso.

$ mdadm --examine /dev/sd[a-z]1 | egrep 'Event|/dev/sd'
mdadm: No md superblock detected on /dev/sda1.
/dev/sdb1:
         Events : 992655
/dev/sdd1:
         Events : 992655
/dev/sde1:
         Events : 992655
/dev/sdf1:
         Events : 992655
/dev/sdg1:
         Events : 158
/dev/sdh1:
         Events : 992655
/dev/sdj1:
         Events : 992655

como você pode ver, meu /dev/sdh1dispositivo não está na matriz há algum tempo e --re-addnão funcionará, e você terá que fazer um - add e para recuperar a matriz.

você pode usar mdadm --detail /dev/md126para assistir ao que está acontecendo; talvez não seja uma boa ideia executá-lo antes de fazer qualquer coisa, afinal esses são seus dados!

$ mdadm --detail /dev/md126
/dev/md126:
        Version : 1.2
  Creation Time : Tue Jun 24 05:17:47 2014
     Raid Level : raid6
     Array Size : 14650158080 (13971.48 GiB 15001.76 GB)
  Used Dev Size : 2930031616 (2794.30 GiB 3000.35 GB)
   Raid Devices : 7
  Total Devices : 7
    Persistence : Superblock is persistent

    Update Time : Thu Nov  6 05:47:56 2014
          State : clean, degraded, recovering
 Active Devices : 6
Working Devices : 7
 Failed Devices : 0
  Spare Devices : 1

         Layout : left-symmetric
     Chunk Size : 512K

 Rebuild Status : 0% complete

           Name : omegacentauri:0  (local to host omegacentauri)
           UUID : 9fdcacc0:14f7ef3c:a6931b47:bfb8b4a1
         Events : 992656

    Number   Major   Minor   RaidDevice State
       0       8       17        0      active sync   /dev/sdb1
       1       8       49        1      active sync   /dev/sdd1
       2       8       65        2      active sync   /dev/sde1
       3       8       81        3      active sync   /dev/sdf1
       4       8       97        4      active sync   /dev/sdg1
       5       8      145        5      active sync   /dev/sdj1
       7       8      113        6      spare rebuilding   /dev/sdh1

ou você também pode usar isso:

$ cat /proc/mdstat
Personalities : [raid1] [raid6] [raid5] [raid4]
md126 : active raid6 sdh1[7] sdg1[4] sdj1[5] sdf1[3] sdd1[1] sde1[2] sdb1[0]
      14650158080 blocks super 1.2 level 6, 512k chunk, algorithm 2 [7/6] [UUUUUU_]
      [>....................]  recovery =  0.9% (26657536/2930031616) finish=1162.5min speed=41624K/sec

md127 : active (auto-read-only) raid1 sdi[1] sdc[0]
      1465007360 blocks super 1.2 [2/2] [UU]

Não sou responsável por nenhum dos seus dados perdidos.

lockwobr
fonte