até agora eu tenho 10 servidores para hpc, voltado para a computação. Meus usuários precisam iniciar vários processos usando o qmake. Os usuários estão acostumados a trabalhar com o ubuntu 9.10, e o software dos repositórios é comutável para eles.
Eu implantei o ubuntu 9.10 em todos os 10 servidores (pxe rocks).
Até agora, trabalhamos com o ssh-paralelo e o cluster-ssh, o que permite iniciar o mesmo processo para todos os servidores. Com essas ferramentas, essas ferramentas permanecem independentes, mas com o mesmo software e o mesmo comando iniciado.
Agora, gostaríamos de avançar para a próxima etapa e ver todos os servidores como um único, com todos os recursos dos outros 9, como se fossem seus recursos.
A diferença seria substancial na hora de processar e também na hora de projetar o comando para iniciar.
Algum conselho sobre qual software usar será muito útil?
obrigado
fonte
Respostas:
O que você está falando é chamado de imagem de sistema único (SSI) . A variante mais comum desse esquema para Linux é implementada pelo MOSIX . Embora ofereça algumas vantagens em termos de gerenciamento do sistema, em geral os processos não podem se estender por vários nós sem usar algum tipo de MPI . Basicamente, independentemente de você usar ou não um cluster "padrão" em execução no mecanismo de grade ou formar seus sistemas em uma única imagem, ainda será necessário modificar todo o software para poder abranger vários nós.
fonte
Um cluster não é uma única máquina em termos de desempenho, a localização fs / memória é importante para o desempenho.
Fazer coisas no nível do aplicativo, embora menos geral, é mais eficiente em termos de recursos. Seu exemplo do qmake pode ser acelerado significativamente configurando o distcc.
fonte
no final, usei o Sun Grid Engine.
Eu documentei em um wiki particular e colei e colei no meu blog. Eu acho que pode ser útil mesmo sem tradução. ;)
Entrada do blog: http://suportrecerca.barcelonamedia.org/blog/?p=240
Se alguém quiser o código wiki, basta perguntar aqui.
Obrigado.
fonte
Eu nunca implementei um antes, mas parece que um cluster de beowulf funcionaria para o que você está tentando fazer. Eu já li muito sobre isso no passado e, para alguns processos mais simples, pode haver pouca recodificação necessária, dependendo do que você está tentando alcançar.
fonte