É possível pausar trabalhos enviados via qsub?

10

Estou executando meus trabalhos em um pequeno cluster. Enviei-os por qsub. Agora, meus colegas de laboratório precisam de recursos com mais urgência do que eu, então preciso matar meus empregos ou pausá-los, se possível.

Existe uma maneira de pausar meus trabalhos e liberar a CPU, RAM, etc.?

Eu sou um usuário normal (sem privilégios de root).

Sibbs Gambling
fonte
1
Você pode reter seus trabalhos que ainda não estão em execução qhold, mas isso não afeta os trabalhos em execução. Parece que qmodpode suspender trabalhos em execução, mas precisa de privilégios de root ou gerente.
Jofel
Supondo que você tenha aglomerado MOAB: você pode suspender o seu trabalho (se configurado de acordo), mas somente administrador pode retomá-lo: docs.adaptivecomputing.com/mwm/Content/topics/jobAdministration/...
Ott Toomet

Respostas:

6

Se os trabalhos não começaram, você pode colocá-los em espera qhold. Use qrlspara reiniciar.

qhold <job ID>
qrls <job ID>

Se eles já estiverem em execução, você poderá qsigsuspender e retomar tarefas (talvez você precise de permissões extras para isso, pergunte ao administrador se esse é o caso):

qsig -s suspend <job ID>
qsig -s resume <job ID>

Depois de retomar seu trabalho, você poderá forçá-lo a executar com qrun

qrun <job ID>

Testado em um sistema SLES 11 SP4 com PBSPro 13.0.2.153173, mas estou confiante de que deve funcionar com outros sistemas de envio de tarefas em lote compatíveis com POSIX.

Calimo
fonte