O servidor SSH trava aleatoriamente uma vez por semana ou mais e volta quando alguém faz login diretamente

0

Eu tenho um Lenovo ThinkPad E560 (Ubuntu 16.04.4 LTS)posto em nosso laboratório remoto com uma corrida openssh serverque pode ser alcançada a qualquer momento. Desde os últimos meses, o servidor ssh trava aleatoriamente uma vez / duas vezes por semana, ainda posso fazer o ping, mas quando tento ssh, recebo " port 22 refused...network unreachable" a mensagem. Se alguém for até lá e fizer login, imediatamente ele ficará acessível por ssh e fine por vários dias; então, aleatoriamente, o laptop não poderá ser acessado por ssh e assim por diante. Eu, mesmo desinstalado e reinstalado openssh server, não resolvi o problema.

O que está causando isso e como posso diagnosticar esse problema corretamente para corrigir isso?

Essa pergunta parece muito familiar, mas não é exatamente o que a maioria das pessoas pergunta, que geralmente é o travamento de uma sessão ssh! Estou perguntando sobre o servidor ssh.

Muito obrigado

quanta
fonte
Primeiro, observe o arquivo /var/log/auth.log. Veja os registros de data e hora, comparando logons bem-sucedidos com os que não tiveram êxito. Se você quiser ver várias mensagens de log de vários arquivos, tente executar 'grep -rsh sshd / var / log | sort' e ele retornará todas as linhas que contêm 'sshd' na pasta / var / log. Isso pode ser muito.
Christopher Hostage
1
Parece que a máquina está indo dormir, então você não pode acessá-la pela rede; mas quando alguém vai fisicamente para a máquina, eles a ativam e a rede fica disponível novamente. Eu não estou familiarizado com o ubuntu ou a Lenovo; existem configurações de "energia" que você pode verificar?
Hymie
@ hyymie é exatamente isso que parece, mas vem acontecendo desde os últimos dois meses, foi bom nos últimos 2 anos. Além disso, o estranho é que, se o sono era o caso, por que levar vários dias, geralmente os computadores dormem dentro de alguns minutos, no máximo, algumas horas. Mas isso ocorre uma vez por semana ou uma vez em duas semanas.
quanta
@Christopher Hostage grep -rsh sshd /var/log |sortnão retorna nada.
quanta

Respostas:

0

Você pode acessar outros serviços (VNC, servidor HTTP, etc.) no laptop remotamente? Se eles agem como o servidor SSH, você pode ter um problema de rede (um problema estranho)

Tente ler os logs SSH

menos /var/log/auth.log | grep ssh

Leia também os outros logs:

menos /var/log/auth.log.1 | grep ssh
gzip -c /var/log/auth.log.2.gz | grep ssh | Menos
gzip -c /var/log/auth.log.3.gz | grep ssh | Menos
... 

Além disso, tente isso apenas no caso de:

Inicialize em um CD ao vivo / em qualquer outra distribuição Linux que você tenha e execute

fsck -yf / dev / sdx
Substitua sdx pelo nome do seu dispositivo de inicialização e reinicie no normal. [Referência: https://serverfault.com/questions/801148/ssh-random-crashing#812544 ]

Shadowcoder
fonte
Eu olhei para /var/log/auth.logo momento em que o acidente aconteceu, a partir de 15 minutos antes de recuperá-lo. Ele travou em torno de 19 de junho, 09:04 CDT, e nós o recuperamos em 19 de junho, 16:26 CDT. Olhei para os logs nesse período, mas vejo tudo normal nesta linha: Jun 19 09:06:04 userid sshd[8**]: Accepted publickey for *** from 192.168.*.* port 5**** ssh2: RSA SHA256:**mas durante esse período eu estava tentando ssh manualmente a partir desse mesmo IP 192.168. *. * e estava recebendo "porta 22 recusada .."
quanta
... também nossa transferência automática de dados estava falhando. Como os logs não mostram nada de errado? Também verifiquei a less /var/log/auth.log.1última entrada em 17 de junho. Outros logs que você sugeriu estão vazios. Infelizmente, não posso fazer uma inicialização USB física, pois o laptop está nos EUA e estou em outro lugar e não temos ninguém lá no momento.
quanta
Bem, eu não tenho nenhuma outra idéia agora, então talvez seja um problema de rede?
Shadowcoder
Posso executar o ping no laptop com êxito, para que a rede esteja funcionando corretamente e o laptop não esteja dormindo com certeza, mas não pode ser habilitado para ssh!
quanta
Eu tenho um Raspberry Pi que faz o que você diz que seu servidor SSH no seu laptop está fazendo. Somente meu problema é corrigido por uma simples reinicialização. Você pode despejar alguns logs com informações relacionadas ao servidor SSH? Poste-os em uma edição da sua pergunta. Além disso, no mês em que isso começou a acontecer, você aplicou atualizações ou sofreu uma falha no laptop (que pode ter corrompido alguma coisa)?
Shadowcoder