Cluster de computação distribuída pequena

13

Eu sou um estudante do ensino médio tentando construir um cluster linux para um projeto (eu tenho um monte de computadores decentes programados para re-imagem neste verão, então o departamento de tecnologia basicamente diz que, desde que eu não os quebre fisicamente, eu posso faça o que for.

Enfim, eu realmente não sei nada sobre a construção de um cluster, mas sou muito bom com o Linux.

Preciso saber o seguinte: -Que distro devo usar? Isso importa? -Que software pode configurar o cluster? - A bordo ou FS distribuído? -Alguns sites que podem oferecer guias decentes ou instruções?

Gilles 'SO- parar de ser mau'
fonte
Qual seria o objetivo do cluster?
Frederik Deweerdt 25/03
Clusters modernos são criados para uma finalidade específica. Geralmente para aplicativos da web ou armazenamento de dados. Talvez você possa experimentar o LVS .
David S.
Como outros escreveram, 'cluster' freqüentemente implica execução paralela, o que requer códigos ou programação especiais. Um uso diferente, mas interessante, de vários computadores trabalhando juntos é o failover ao vivo de sistemas de arquivos espelhados. Reserve um minuto e veja DRBD e sistemas de arquivos em cluster. Isso também pode lhe dar idéias: xenamo.sourceforge.net
pboin

Respostas:

6

Realmente depende do que você está tentando realizar e do que você entende por "Cluster de Computação Distribuída". Fiz uma coisa semelhante uma vez na Uni, usando máquinas antigas e PVM, que é o "Cluster" no sentido de um monte de máquinas agindo como um único computador para fazer processamento paralelo - pense nos clusters Beowulf. Obviamente, você precisará de um código escrito para tirar proveito disso.

Um bom lugar para começar seria determinar o que você deseja aprender com este projeto. Eu recomendo ler o artigo da Wikipedia sobre computação paralela para iniciantes e refinar suas necessidades com base no que você deseja fazer.

Um sistema simples de enfileiramento de tarefas (como o gearman ) pode ser suficiente para obter resultados interessantes rapidamente.

O problema que tive ao criar um cluster de computação paralela era que eu não tinha nada para fazer, apenas ficava lá, mas era um projeto divertido e eu aprendi bastante. De qualquer forma, é provável que você aprenda um pouco e se divirta ao mesmo tempo, independentemente do que optar por implementar.

No que diz respeito à escolha das distribuições, eu aceitaria o que eu mais me sentia confortável, pois você provavelmente precisará instalar as coisas da fonte. Quando estiver satisfeito com a configuração de tudo, poderá procurar uma distribuição mais adaptada às suas necessidades. Mas qualquer distribuição deve funcionar.

Qual software configurar o cluster? Isso depende inteiramente do tipo de cluster que você cria.

A bordo vs. FS distribuído? Novamente, isso depende de quais são os requisitos para seu cluster. Cada nó passará dados entre os outros nós? Eles irão operar como escravos com um único mestre? eles operarão completamente de forma independente? Essas perguntas começarão a informar suas escolhas. E, claro, sempre existem compensações.

Alguns outros links que podem ser interessantes:

http://hadoop.apache.org/

http://www.csm.ornl.gov/oscar/

https://computing.llnl.gov/tutorials/parallel_comp/

http://www.google.com/Top/Computers/Parallel_Computing/Programming/Environments/

http://www.google.com/Top/Computers/Parallel_Computing/Beowulf/

Gabe.
fonte
1

Essa é uma sugestão muito simples e não desenvolvida; mas talvez tente um cluster do Plan 9? http://plan9.bell-labs.com/plan9/

hiperbolt
fonte
-1

Experimente o Linux HA (High Availability), é uma solução de cluster Linux disponível gratuitamente que funciona em várias distribuições.

Provavelmente é apenas uma das várias soluções. Não sei como ele se compara com os outros, ou mesmo quais são suas características específicas, apenas sei que alguns colegas de trabalho juraram por ele um software comercial sério.

asoundmove
fonte