DRDY ERR do HDD

2

De repente, comecei a obter o DRDY ERR com meu laptop rodando linux ... algumas mensagens se parecem ..

    ata1:00: status: { DRDY ERR }
    ata1.00: error {UNC }
    ata1:00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
    ata1:00: BMDMA stat 0x25
    ata1:00: failed command: READ DMA

finalmente, ele me coloca em um prompt de comando, solicitando que eu entre em um nível de execução e depois disso

    INIT: no more processes left in this runlevel

Suspeitando de uma falha no disco rígido, tirei-o e usei-o em outro PC como unidade externa de disco rígido USB e consegui montar e visualizar todas as partições e arquivos dentro dele. Então, eu suponho que o disco esteja OK.

[EDIT / UPDATE]

Também consigo inicializar o laptop a partir de um pen drive USB com linux) e até ver todas as partições no disco e acessá-las.

Também tirou o disco rígido e o colocou em uma caixa externa e tentou inicializar no mesmo laptop, mas seguiu erros diferentes

    end_request: critical target error, dev sda, sector 32839936
    EXT4_fs error: (device sda5): ext4_find_entry:935: inode #393217: comm init: reading directory lblock 0

    INIT: No inittab file found
    Enter runlevel:

Então eu acho que o HDD é acessível como armazenamento, mas não inicializável. O esquema de particionamento no disco rígido é como se isso ajudasse .. (esquema GPT)

    partition   FileSystem  size    flags
    ---------   ----------- ----    -----
    /dev/sda1   unknown     2.00MB  bios_grub
    /dev/sda2   ext2        128MB           # was supposed to be common boot partition for chain loading
    /dev/sda3   swap        1.5GB
    /dev/sda4   ext4        8GB         # Linux 1 (somehow, Grub does not show this in the menu, cannot boot into)
    /dev/sda5   ext4        8GB         # Linux 2 (I could only boot into this one from Grub.)
    /dev/sda6   ext4        94GB        # DATA
    unallocated _           1MB

Eu instalei linuxes um após o outro e realmente queria instalar o Grub no / dev / sda2 e carregar o Linux 1 e 2 em cadeia, mas antes que eu pudesse fazê-lo, encontrei esse problema!

Alguma ideia? Soluções?

[ATUALIZAÇÃO 2]

  • O título do problema não é mais aplicável *

Inicializei a partir do USB e fiz um 'fsck' em todas as partições. Todos (exceto / sda5) foram relatados como limpos. / dev / sda5 relatou muitos erros (provavelmente em torno de algumas centenas), eu apenas continuei digitando 'y' para todos os prompts. Entre havia mensagens como 'ligando' perdidas + encontradas '....' Depois que um runnning 2 passa em todas as partições, quando reiniciei a partir do disco rígido, aqui está o erro mais recente ...

    INIT: verision 2.88 booting
    INIT: No inittab file file found

    Enter runlevel:

Parece que eu seria capaz de voltar a instância do SO e inicializar?

yogmk
fonte
O pen drive inicializa em outro sistema?
a CVn
Hmmm ... Não! Eu tentei em outro laptop, que não conseguiu encontrar o MBR. Eu o formatei e o inicializei através de outro programa ("Universal USB Installer" desta vez) que me avisou durante o processo que ocorreu um erro e a unidade pode não ser inicializável. Parece que a unidade desenvolveu algum problema (embora os dados sejam acessíveis) e eu preciso encontrar outra unidade de caneta e voltar aqui com erros, se houver.
Yogmk
11
Observe que os failed command: READ DMApontos em direção ao disco rígido estão com problemas. Ele poderia ser outra coisa também, mas eu definitivamente não assumir que o HDD é OK. Minha recomendação seria atualizar o backup (idealmente para algumas mídias que não sejam as mais recentes) antes que algo aconteça com a unidade e ela se recuse totalmente a funcionar.
um CVn
Além disso, veja se você pode focalizar esta pergunta. No momento, trata-se de dois problemas (o disco rígido com falha no READ DMA e o thumbdrive na inicialização). É melhor dividir isso em duas perguntas separadas que podem ser respondidas individualmente, pois é extremamente improvável que os problemas tenham a mesma causa.
um CVn
Acontece que a caneta USB não estava com defeito, afinal. Eu estava usando o unetbootin no meu laptop fornecido pelo escritório. Provavelmente, o programa de criptografia de disco e / ou as permissões do Windows (eu nunca os entendi!) Impediram a cópia de alguns arquivos. Unetbootin não me disse isso. No entanto, o 'Universal USB Installer' mostrou alguns erros e também me disse que o USB pode não ser inicializável! Então criei o USB novamente (desta vez a partir de uma VM do Windows barebones no mesmo laptop e usando UUI) e funcionou. Atualizado o post, agora com outros sintomas do que aconteceu a seguir!
Yogmk

Respostas:

3

O primeiro erro que você reportou:

ata1:00: status: { DRDY ERR }
ata1.00: error {UNC }
ata1:00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
ata1:00: BMDMA stat 0x25
ata1:00: failed command: READ DMA

diz que um READ DMAcomando ATA para um disco na porta ATA 1 falhou (status inclui ERRde erro ). Essa porta provavelmente é o disco rígido e o erro indica que a unidade está com problemas. A DMAparte provavelmente pode ser ignorada; O DMA é o Direct Memory Access, que é o modo de transferência dominante hoje em dia, e se você estivesse com problemas de RAM ou de barramento de RAM na medida em que estava atingindo algo parecido repetidamente, provavelmente estaria vendo muitos erros a mais se o sistema estivesse funcionando. capaz de funcionar.

O segundo erro:

end_request: critical target error, dev sda, sector 32839936
EXT4_fs error: (device sda5): ext4_find_entry:935: inode #393217: comm init: reading directory lblock 0
INIT: No inittab file found

diz que há algum problema no / dev / sda, setor 32839936, que com setores de 512 bytes nos coloca fisicamente no final da partição / dev / sda5, que é complementada device sda5conforme relatado pelo driver do sistema de arquivos. O erro relatado initjuntamente com os detalhes do erro do driver do sistema de arquivos aponta para um problema no sistema de arquivos que faz com que o / etc / inittab fique indisponível ou (menos provável) ilegível. Isso significa que o diretório raiz, o diretório / etc ou a entrada do arquivo / etc / inittab está de alguma forma envolvida na corrupção. Dado o número do inode, eu consideraria o / etc / inittab especificamente o culpado, até que se provasse errado.

Você escreve (minha ênfase):

Suspeitando de uma falha no disco rígido, tirei-o e usei-o em outro PC como unidade externa de disco rígido USB e consegui montar e visualizar todas as partições e arquivos dentro dele. Então, eu suponho que o disco esteja OK.

Eu diria que sua suposição é infundada. O disco está obviamente tendo algum problema; com alguma sorte, será fácil consertar.

A primeira coisa que eu faria na sua situação é atualizar meu backup de tudo o que está nesse disco. Certifique-se de não substituir ou excluir nada do backup mais recente, pois certamente existe a possibilidade de que você precisará dele. Talvez a melhor opção seja fazer um novo backup em uma nova unidade (ou pelo menos não usada anteriormente para seus próprios backups) de tudo o que você puder acessar. Espere alguns erros de E / S na fonte ao fazer essa cópia.

Segundo vem a tentativa de recuperação. Com alguma sorte, dados os erros, esse é um problema de setor único ou de poucos setores que causou uma pequena quantidade de corrupção no sistema de arquivos; nesse caso, e2fsck deve ser capaz de reparar a maior parte dos danos. É provável que alguns de seus arquivos tenham desaparecido, mas com alguma sorte, você poderá encontrá-los em / lost + encontrado na raiz de montagem do sistema de arquivos (ou seja, por exemplo / data / lost + encontrado se você montar / dev / sda5 em / dados) após o e2fsck fazer o que pode. Caso contrário, faça uma comparação com o backup mais recente antes do início dos problemas e restaure os arquivos relevantes do backup. (Mencionei que os backups são úteis se coisas ruins acontecem, como inevitavelmente acontecem?)

Terceiro, surge a questão de saber se você pode confiar na unidade para uso futuro. Alguns setores ruins não precisam ser catastróficos do ponto de vista da unidade, mas as unidades rotacionais com aproximadamente 100 GB de tamanho praticamente não podem ser adquiridas hoje em dia na maioria dos fatores de forma, o que indica que essa unidade é relativamente antiga. Pessoalmente, eu provavelmente aceitaria que a unidade perdesse sua vida útil nesse momento e conseguisse uma substituição, mas, novamente, sou bastante paranóica quando se trata de meus dados; sua milhagem pode variar. Você terá que ponderar o custo de uma unidade de substituição contra o risco de falha total da unidade e a perda total subsequente de todos os dados na unidade.

um CVn
fonte
[Eu fiz isso antes que eu vi sua resposta, mas não tive a oportunidade de atualizar a questão]
yogmk
..cont'd Consulte [ATUALIZAÇÃO 2] para a pergunta acima. Obrigado pela sua resposta detalhada. De qualquer forma, o laptop é antigo e agora é meu 'brinquedo educacional', mas é útil e eu gostaria de mantê-lo funcionando o máximo possível. Ele possui um HD de 111GB ​​de 1,8 polegadas. Eu poderia substituí-lo se vier a isso. E eu tenho coisas importantes nele. (A partição / DATA possui todos os dados (fotos, músicas) que até agora estão limpos / acessíveis).
Yogmk
@yogmk Não vejo como sua edição invalida minha resposta? A execução do e2fsck foi a primeira parte do meu "segundo ponto", na tentativa de recuperação. Agora que o sistema de arquivos provavelmente está OK, é necessário recuperar os arquivos que estão faltando porque os metadados para eles estavam corrompidos ou ilegíveis.
um CVn
Não estou contestando sua resposta, estou aceitando. Agora, no meu caso, o diretório / etc inteiro está vazio após o fsck e existem cerca de 300 fragmentos de arquivo despejados em / lost + found :(. Decidi recarregar o sistema operacional porque recuperar tudo manualmente não vale a pena. Obrigado.
Yogmk