Eu tenho um compartimento de unidade externa com 4 discos eSATA. Meu sistema possui uma placa eSATA de 4 portas, além de um par de unidades RAID1 de hardware interno. As unidades externas estão em pares de software RAID1 como /dev/md0
e /dev/md1
. Ambos foram configurados como volumes físicos LVM para criar meu storagevg
grupo de volumes LVM. Recentemente, uma única unidade ficou offline (suspeito de cabos), mas não parece ser uma boa maneira de identificar fisicamente qual unidade eu preciso verificar, principalmente porque a ordem de inicialização não é a mesma entre as botas. Como posso encontrar o disco que precisa de atenção?
Se você tiver problemas para corresponder o número de série da unidade ou a indicação da porta com os locais espaciais dos discos, poderá executar
cat /dev/sdz >/dev/null
(ondesdz
está a unidade com falha) e localizar a unidade pelo LED (ou pelo ouvido, se você não estiver em uma sala de servidores barulhenta) ) Se a unidade nem ligar, isso deve ser suficiente para dizer qual é. Certifique-se de colocar uma etiqueta visível nos discos para a próxima vez.fonte
A informação que
udisks
fornecidas (na linha de comando ou no GNOME Disk Utility ) incluem o número de série do disco. Nos discos que tenho, o número de série é impresso no lado superior e no lado frontal (aquele do outro lado do que contém os conectores), tanto em números quanto em código de barras. Infelizmente, a maioria dos casos de PC impossibilita a leitura desses seriais sem puxar o disco para fora ...Você também pode encontrar os números de série em
/dev/disk/by-id/
.Como seu disco está offline, presumo que ele não seja "visto" pelo kernel atualmente? Nesse caso, talvez seja necessário eliminar: você deseja o disco com um número de série que não esteja listado ...
fonte
Com a invasão de software, esse é um problema comum. Os ataques de hardware tendem a ter um recurso que permite piscar o LED associado a uma unidade, assumindo que seu hardware seja compatível.
Porém, com o RAID de software, cada unidade possui alguns metadados exclusivos. Você pode lê-lo em cada unidade usando o comando
mdadm -E /dev/sda1
para cada unidade na matriz, modificando os dispositivos para corresponder ao seu ambiente. Portanto, se você tiver uma situação em que uma unidade está causando problemas e está atualmente offline. Eu executaria isso em cada unidade que estiver online, registrando o número menor de cada unidade. Em seguida, usando um Live CD que suporta MD, o CD de recuperação do sistema é bom, com apenas uma unidade de cada vez conectada e executando este comando para encontrar o culpado. Isso provavelmente não é tão direto quanto você gostaria, mas deve funcionar.fonte
lsscsi
se o disco não estiver em execução, é um bom sinal. Portanto, / proc / mdstat lhe dirá qual membro falhou. Supondo que você não tenha uma gaiola de disco agradável, precisará detalhar o número de série, o sg_inq deve ajudar com isso.
Se você tiver um bom compartimento de unidades, poderá ativar o beacon do disco para ajudar a identificar o membro defeituoso.
http://www.mail-archive.com/[email protected]/msg07307.html
fonte
Para obter os códigos de série de todos os discos rígidos, execute:
fonte
É simples. Por exemplo, esta é a saída no meu PC:
como você pode ver, juntei / dev / sdh1 e / dev / sdg1 em / dev / md0
fonte
Como sua matriz não possui inteligência SES e o LED de atividade do disco não é diretamente acionável, por exemplo, você precisa de suporte de firmware para isso. A única outra coisa que você pode fazer é desativar a E / S da melhor maneira possível e, em seguida, usar algo como
dd
ousg_read
nos próprios membros para passar um padrão de leituras para o disco que cria um padrão de piscada identificável exclusivamente usando o LED de atividade, um indicador farol do homem, se você quiser. É realmente sua única alternativa, a menos que reduzir a matriz seja uma opção.Esse tipo de manutenção é o que diferencia as matrizes de armazenamento externo. Como você não planejou com antecedência anotando os números de série e suas posições, não é possível fazer a diferença simples de conjunto para identificar a unidade defeituosa. É o preço que você paga pela solução implantada, se você percebe ou não, mas ei, viva e aprenda.
fonte