Estou vendo processos no meu SGI Altix 450 executando o SLES 10.1 aparentemente parando de funcionar (ou seja, não fornecendo saída adicional em seus logs por horas). Neste ponto, quero interromper o processo incorreto para poder reiniciá-lo. A parte superior mostra que o processo está no estado (R). Embora quando eu tento matá-lo, nada acontece. Mesmo quando eu uso o kill -9, ele ainda permanece. Nesse caso, o que posso fazer além de reiniciar a máquina?
9
Respostas:
É possível que o processo seja interrompido, mas aguardando que o pai colete seu valor de retorno. Nesse caso, após ser morto, ele estaria no estado 'Z' e não em 'R'. Nesse caso, você deve encontrar o
ppid
processo usando ops
comando e matar o processo pai também (se tiver certeza de que ele não causará problemas).O outro caso pode ser que, por algum motivo, o processo seja reiniciado após ser morto como tty. Nesse caso, a identificação do processo deve mudar toda vez que você mata -9. Veja se o ID do processo está mudando toda vez que você tenta matá-lo.
fonte
O processo está aguardando algum recurso do sistema, talvez o NFS? isso não está permitindo que 'deixe ir'. Gostaria de ouvir algumas soluções para isso além do meu ...
reinicie a caixa ou deixe o processo parado.
Gostaria de saber se você pode 'PARAR' o processo via kill -STOP {PID} para impedir que ele consuma mais CPU.
A reinicialização deve ser possível mesmo com outro processo parado, mas pode exigir uma porta de lista ou segmento de memória compartilhada que ainda esteja em uso pelo outro processo.
fonte
ls
comando em uma montagem s3fs. Ols
processo não vai acabar,kill -9
até eu forçar a desmontagem comumount -l
Você já conferiu o dmesg? Eu vi isso depois de um pânico no kernel; a única maneira de recuperar é reiniciar (de preferência em breve) - e obter um kernel corrigido.
Os processos não-capacitáveis normais estarão no estado D, não R.
fonte