como interpretar esses erros do syslog

12

Meu Ubuntu tem agido de forma estranha ultimamente. Ontem, ele não inicializava normalmente, então tive que fazer uma inicialização no 'modo de recuperação'. Ele disse que tinha que fazer um fsckmanualmente, o que fiz usando um CD ao vivo. Depois disso, eu já era capaz de inicializar na área de trabalho, mas tudo fica muito lento. Os aplicativos ficam cinza por segundos. Às vezes, outros aplicativos nem iniciam. Em outros casos, está dizendo que o sistema de arquivos está no modo somente leitura.

Isso faz parte do que tenho recebido:

Oct 26 21:23:56  kernel: [ 1900.960506] sd 0:0:0:0: [sda] Add. Sense: Unrecovered read error - auto reallocate failed
Oct 26 21:23:56  kernel: [ 1900.960533] end_request: I/O error, dev sda, sector 63206544
Oct 26 21:23:56  kernel: [ 1900.960541] Buffer I/O error on device sda1, logical block 7900562
Oct 26 21:24:00  kernel: [ 1904.146683]          res 51/40:00:90:74:c4/00:00:00:00:00/03 Emask 0x9 (media error)
Oct 26 21:24:00  kernel: [ 1904.146692] ata1.00: error: { UNC }
Oct 26 21:24:03  kernel: [ 1907.351844]          res 51/40:00:90:74:c4/00:00:00:00:00/03 Emask 0x9 (media error)
Oct 26 21:24:03  kernel: [ 1907.351853] ata1.00: error: { UNC }
Oct 26 21:24:06  kernel: [ 1910.482152]          res 51/40:00:90:74:c4/00:00:00:00:00/03 Emask 0x9 (media error)
Oct 26 21:24:06  kernel: [ 1910.482161] ata1.00: error: { UNC }
Oct 26 21:24:09  kernel: [ 1913.604742]          res 51/40:00:90:74:c4/00:00:00:00:00/03 Emask 0x9 (media error)
Oct 26 21:24:09  kernel: [ 1913.604751] ata1.00: error: { UNC }
Oct 26 21:24:12  kernel: [ 1916.792646]          res 51/40:00:90:74:c4/00:00:00:00:00/03 Emask 0x9 (media error)
Oct 26 21:24:12  kernel: [ 1916.792656] ata1.00: error: { UNC }
Oct 26 21:24:15  kernel: [ 1919.922855]          res 51/40:00:90:74:c4/00:00:00:00:00/03 Emask 0x9 (media error)
Oct 26 21:24:15  kernel: [ 1919.922864] ata1.00: error: { UNC }
Oct 26 21:24:16  kernel: [ 1920.056506] sd 0:0:0:0: [sda] Add. Sense: Unrecovered read error - auto reallocate failed
Oct 26 21:24:16  kernel: [ 1920.056533] end_request: I/O error, dev sda, sector 63206544
Oct 26 21:24:16  kernel: [ 1920.056540] Buffer I/O error on device sda1, logical block 7900562
Oct 26 21:24:55  kernel: [ 1959.134566]          res 51/40:00:e0:28:44/00:00:00:00:00/04 Emask 0x9 (media error)
Oct 26 21:24:55  kernel: [ 1959.134575] ata1.00: error: { UNC }
Oct 26 21:25:05  kernel: [ 1969.674292]          res 51/40:00:b2:4c:44/00:00:00:00:00/04 Emask 0x9 (media error)
Oct 26 21:25:05  kernel: [ 1969.674301] ata1.00: error: { UNC }
Oct 26 21:25:08  kernel: [ 1972.887782]          res 51/40:00:b2:4c:44/00:00:00:00:00/04 Emask 0x9 (media error)
Oct 26 21:25:08  kernel: [ 1972.887791] ata1.00: error: { UNC }
Oct 26 21:25:12  kernel: [ 1976.059674]          res 51/40:00:b2:4c:44/00:00:00:00:00/04 Emask 0x9 (media error)
Oct 26 21:25:12  kernel: [ 1976.059683] ata1.00: error: { UNC }
Oct 26 21:25:15  kernel: [ 1979.206592]          res 51/40:00:b2:4c:44/00:00:00:00:00/04 Emask 0x9 (media error)
Oct 26 21:25:15  kernel: [ 1979.206601] ata1.00: error: { UNC }
Marky
fonte

Respostas:

11

Seu primeiro disco rígido (sda) está em processo de falha agressiva.

Desligue-o imediatamente, obtenha uma nova unidade de inicialização, instale um novo sistema operacional na nova unidade de inicialização. Quando estiver funcionando, conecte a unidade com falha, monte-a "somente leitura" e você poderá extrair dados dela.

Claro, como a maioria das pessoas, você tem backups completos e atuais, certo? ;)

adicionado em resposta ao comentário

"Falhas infantis" são tão comuns na engenharia de hardware que existe um termo para elas. Em geral, um dispositivo falhará muito cedo ou será executado por um bom tempo. Se você está tendo falhas repetidas, você também é:

  1. comprar discos baratos (eu pessoalmente tive mais problemas com as unidades Brand Foo do que posso contar (mas minha experiência pessoal não pode ser usada para fazer uma declaração geral sobre um fabricante e foi por isso que não escrevi "Maxtor")) .
  2. tendo alguma má sorte. O mesmo poderia acontecer com as lâmpadas: haverá um cara que tem as próximas duas lâmpadas que ele compra falham em uma semana. As estatísticas deles para você e você pode ser apenas "aquele cara" com as unidades.
  3. você realmente tem um controlador de unidade ruim que está queimando os componentes eletrônicos da unidade. Por exemplo, pode haver um resistor fora da especificação em uma linha de controle de unidade e fritará todas as unidades conectadas a ele.

Eu acho que essas três possibilidades são muito, muito mais prováveis ​​do que você descobrir uma falha fatal no EXT4; acabou de ser batido com muita força. Então, novamente, possessão demoníaca pode estar em jogo, consulte o clero de sua escolha e boa sorte.

msw
fonte
Nunca é demais comentar ao apontar para a importância dos backups.
Takkat 26/10/10
Tecnicamente, pode ser um cabo solto (ou até mesmo um jumper solto); portanto, verifique se você agitou o computador recentemente. Mas, em qualquer caso, é uma falha de hardware e o disco é o culpado mais provável.
Gilles 'SO- stop be evil'
Oh não! :( Este é praticamente um disco novo. Ele não tem nem 3 meses de idade. Como isso poderia acontecer? Enquanto minha outra unidade SATA tem mais de 2 anos usada pelas partições Windows XP - NTFS e é muito saudável. Juro algo está errado com o ext4 FS tive 2 drives IDE antes deste acidente também..
Marky
@Markey: veja "adicionado" acima "
msw
Sou um grande fã do SeaGate desde então. Meu disco NTFS é um Barracuda de 2 anos e é tão saudável desde que o comprei. Esta unidade mais recente também é um SeaGate. (1) Alguma sugestão para uma unidade melhor? WD não é uma opção. Não acho que esteja disponível na minha região. (2) Não pode ser um controlador ruim, minha unidade NTFS também teria sido frita. (3) Quanto vale a pena, vou dar azar. RI MUITO! :)
Marky
1

Você pode verificar a integridade do seu disco rígido usando a Ferramenta Utilitário de Disco. Clique em Sistema / Administração / Utilitário de Disco, localize seu disco rígido na janela à esquerda e clique nele, clique no botão "Dados SMART" à direita. Dê uma olhada na avaliação de cada item, bem como na avaliação geral na parte superior. Se não estiver verde, seu disco está definitivamente falhando.

mdeslaur
fonte
1
Isso é desnecessário, pois o log já demonstra que está falhando. Manter a unidade ligada por mais tempo do que o absolutamente necessário aumenta a chance de perda adicional.
quer
1
ainda mais arriscado do que apenas ligar os movimentos da cabeça ao verificar a integridade do disco. Tudo isso pode ser reproduzido após a recuperação dos dados, que é a prioridade 1 agora.
Takkat 26/10/10
Normalmente, a Marky já deveria ter recebido avisos sobre isso ao usar uma instalação da área de trabalho com o Disk Utility instalado, certo?
JanC 26/10/10
Não, isso aconteceu de repente, sem avisos claros. Naturalmente, como o disco é relativamente novo, eu não esperava isso. O teste SMART diz que passou, mas observa que existem alguns setores defeituosos. A cor ainda é verde a propósito. Quanto tempo você acha que o disco ainda pode ser usado?
Marky