Eu sou um estudante do ensino médio tentando construir um cluster linux para um projeto (eu tenho um monte de computadores decentes programados para re-imagem neste verão, então o departamento de tecnologia basicamente diz que, desde que eu não os quebre fisicamente, eu posso faça o que for.
Enfim, eu realmente não sei nada sobre a construção de um cluster, mas sou muito bom com o Linux.
Preciso saber o seguinte: -Que distro devo usar? Isso importa? -Que software pode configurar o cluster? - A bordo ou FS distribuído? -Alguns sites que podem oferecer guias decentes ou instruções?
linux
cluster
distributed-filesystem
Gilles 'SO- parar de ser mau'
fonte
fonte
Respostas:
Realmente depende do que você está tentando realizar e do que você entende por "Cluster de Computação Distribuída". Fiz uma coisa semelhante uma vez na Uni, usando máquinas antigas e PVM, que é o "Cluster" no sentido de um monte de máquinas agindo como um único computador para fazer processamento paralelo - pense nos clusters Beowulf. Obviamente, você precisará de um código escrito para tirar proveito disso.
Um bom lugar para começar seria determinar o que você deseja aprender com este projeto. Eu recomendo ler o artigo da Wikipedia sobre computação paralela para iniciantes e refinar suas necessidades com base no que você deseja fazer.
Um sistema simples de enfileiramento de tarefas (como o gearman ) pode ser suficiente para obter resultados interessantes rapidamente.
O problema que tive ao criar um cluster de computação paralela era que eu não tinha nada para fazer, apenas ficava lá, mas era um projeto divertido e eu aprendi bastante. De qualquer forma, é provável que você aprenda um pouco e se divirta ao mesmo tempo, independentemente do que optar por implementar.
No que diz respeito à escolha das distribuições, eu aceitaria o que eu mais me sentia confortável, pois você provavelmente precisará instalar as coisas da fonte. Quando estiver satisfeito com a configuração de tudo, poderá procurar uma distribuição mais adaptada às suas necessidades. Mas qualquer distribuição deve funcionar.
Qual software configurar o cluster? Isso depende inteiramente do tipo de cluster que você cria.
A bordo vs. FS distribuído? Novamente, isso depende de quais são os requisitos para seu cluster. Cada nó passará dados entre os outros nós? Eles irão operar como escravos com um único mestre? eles operarão completamente de forma independente? Essas perguntas começarão a informar suas escolhas. E, claro, sempre existem compensações.
Alguns outros links que podem ser interessantes:
http://hadoop.apache.org/
http://www.csm.ornl.gov/oscar/
https://computing.llnl.gov/tutorials/parallel_comp/
http://www.google.com/Top/Computers/Parallel_Computing/Programming/Environments/
http://www.google.com/Top/Computers/Parallel_Computing/Beowulf/
fonte
Essa é uma sugestão muito simples e não desenvolvida; mas talvez tente um cluster do Plan 9? http://plan9.bell-labs.com/plan9/
fonte
Experimente o Linux HA (High Availability), é uma solução de cluster Linux disponível gratuitamente que funciona em várias distribuições.
Provavelmente é apenas uma das várias soluções. Não sei como ele se compara com os outros, ou mesmo quais são suas características específicas, apenas sei que alguns colegas de trabalho juraram por ele um software comercial sério.
fonte