Práticas recomendadas para virtualização de servidores na SAN?

17

Tudo bem, então eu quero começar a alavancar minha SAN um pouco mais do que fui e, ao mesmo tempo, tirar proveito do ESXi.

Atualmente, tenho uma matriz de blades Dell PowerEdge 1955 conectados a uma matriz de armazenamento EMC AX4-5 FC de gabinete único. Estou essencialmente usando a SAN como DAS. Eu tenho LUNs na SAN que apontam para máquinas físicas específicas e essas máquinas utilizam os LUNs para qualquer coisa (principalmente bancos de dados e compartilhamentos Samba / NFS, dependendo do servidor de destino).

Eu tenho vários servidores de arquivos físicos e cada um tem uma configuração de samba para servir os compartilhamentos apropriados. Como eu nunca fiz o RHCS funcionar, apenas um dos servidores de arquivos possui os LUNs montados por vez. No caso de um servidor de arquivos morrer, eu o cerco manualmente (desmontando e não apresentando a unidade, usando o utilitário navisphere ou eliminando a energia via DRAC) e, em seguida, use o utilitário navisphere para exibir os LUNs apresentados no próximo candidato ( depois disso, inicie o apache e os outros daemons). Tudo à mão, agora.

Sinto-me como Ferris Bueller tocando clarinete. Nunca tive uma lição!

Enfim, estou tentando melhorar. O que eu quero fazer é instalar o ESXi nos hosts físicos e criar LUNs para armazenar duas imagens do servidor de arquivos (caso uma fique corrompida / fubar), uma das quais estará ativa e a outra estará em espera. Pelo menos dessa maneira, não melhoro a automação (embora eu escreva um script para alternar o servidor "ativo" em algum momento), mas sinto que estou adicionando flexibilidade, além de poder usar os hosts ESXi suportam outras VMs e o hardware não será desperdiçado, como é agora.

Minhas perguntas são:

1) Quão estúpido é o meu plano?

2) Quando se trata da implementação real, devo criar uma imagem vmdk normal no LUN ou devo fornecer uma partição "bruta" (se isso é possível com o ESXi?)

3) Existe uma maneira "boa" de usar servidores de arquivos não em cluster?

Matt Simmons
fonte

Respostas:

7

Seu plano não é louco. Como sempre, existem mais do que algumas maneiras de atacar isso com base no que você está tentando alcançar e em como proteger seus dados.

Primeiro, você pode apresentar um LUN bruto para uma VM usando um "Mapeamento de dispositivo bruto". Para fazer isso:

  • Apresente o LUN ao host ESXi (ou grupo de hosts, se você estiver usando cluster / HA)
  • Adicione um disco à sua VM, selecione Mapeamento de dispositivo bruto, aponte para o LUN
  • Digitalize novamente o barramento SCSI dentro da VM
  • fdisk, monte e adicione ao fstab, exatamente como um disco normal.

De cabeça para baixo: rápido de configurar, rápido de usar, fácil, pode representar o disco para o host físico, se você precisar fazer o V2P no caminho

Desvantagem: você pode perder algumas opções de captura instantânea / reversão baseadas no VMware, dependendo se você usa o modo de compatibilidade física ou virtual

Uma opção alternativa é criar o VMFS no LUN para criar um armazenamento de dados e, em seguida, adicionar um disco VMDK à VM que vive nesse armazenamento de dados.

  • De cabeça para baixo: é favorável ao Storage vMotion se você comprar uma licença para usá-lo. Isso permite a migração rápida de discos VMDK entre LUN e até SAN.

Nos dois casos, você está em uma posição de risco semelhante, caso a VMware ou sua VM coma o sistema de arquivos durante uma falha; um não é drasticamente melhor que o outro, embora as opções de recuperação disponíveis sejam bem diferentes.

Eu não implanto RDMs, a menos que seja necessário; Descobri que eles não me compram muita flexibilidade como um VMDK (e fui picado por erros que os tornaram impraticáveis ​​ao executar outras operações de armazenamento (desde que corrigidos - consulte a seção RDM nesse link))


Quanto à sua VM, sua melhor aposta em flexibilidade é armazenar o disco de inicialização do servidor de arquivos como um VMDK na SAN, para que outros hosts possam inicializá-lo no caso de uma falha no host. Usando a funcionalidade de alta disponibilidade da VMware, a inicialização da sua VM em outro host é automática (a VM inicializa no segundo host como se a energia tivesse sido consumida; espere executar o fsck e a mágica usuais para trazê-lo à tona, como no caso de um servidor normal ) Observe que o HA é um recurso licenciado.

Para mitigar uma falha na VM, você pode criar um clone leve do servidor de arquivos, contendo o mínimo necessário para inicializar e fazer com que o SAMBA inicie em um estado configurado e armazene-o no disco local de cada host, aguardando a adição da unidade de dados do VM com falha e ligue-a.

Isso pode ou não comprar opções extras para você no caso de uma falha na SAN; Na melhor das hipóteses, seu armazenamento de dados exigirá um fsck ou outro reparo, mas pelo menos você não precisa corrigir, reconstruir ou configurar a VM no topo. Na pior das hipóteses, você perdeu os dados e precisa voltar para a fita ... mas você já estava nesse estado.

Greg Work
fonte
1

Eu ficaria com as imagens vmdk, apenas no caso de você usar o vmotion no futuro, você nunca sabe que poderá obter um orçamento para isso.

Se suas máquinas não estiverem agrupadas, a melhor maneira de gerenciá-las é tentar espalhar a carga o mais uniformemente possível. Eu tenho 3 2950 não agrupados, onde a carga dos vms mais críticos é o máximo possível de 1/3 em cada um. Como é improvável que você perca mais de uma caixa de uma só vez, pelo menos 2/3 poderão continuar operando sem afetar.

Do ponto de vista energético, provavelmente seria mais eficiente carregar as máquinas o mais próximo possível de 100% e ter outras máquinas desligadas, mas parece colocar todos os seus ovos em uma cesta para mim.

Eu não me chamaria de especialista nisso, é exatamente o que eu faço.

chewy_fruit_loop
fonte
1

Hey Matt. Existem várias maneiras de dividir uma solução quando você usa uma solução de virtualização. Primeiro, houve muitos benchmarks mostrando o desempenho do Raw LUN (RDM) versus VMDK e a diferença geralmente é desprezível. Alguns aspectos a serem observados com os RDMs: Apenas determinadas situações de cluster requerem o uso de RDMs (clustering MS). Os RDM têm um limite de 2 TB, mas o LVM pode ser usado para contornar esse limite. Os RDMs são 'mais difíceis' de controlar do que dar um LUN ao ESXi para usar no VMFS e colocar vmdk nele. Os VMDKs (como mencionado) têm alguns benefícios interessantes: svMotion, Snapshots (não é possível capturar instantaneamente um pRDM).

Se estiver executando o Free ESXi, eis como eu posso lidar com a sua situação. Primeiro, todos os dados estão nos arquivos vmdk no VMFS LUNS. Configure 2 VMs e use Heartbeat para failover de IP e serviços. A pulsação passará o IP do serviço e poderá lidar com scripts para desmontar / montar o LUN de dados, quando apropriado. Você pode até criar scripts para alguma VMware Remote CLI para garantir que a VM 'inativa' seja desligada para proteção. Com a pulsação, a coordenação direta entre os sistemas e o risco de acessar os dados lun / executar os mesmos serviços devem ser extremamente baixos. A chave aqui é garantir que a montagem / desmontagem do LUN de dados e a inicialização / desligamento dos serviços sejam gerenciadas pelo Heartbeat, não pelos mecanismos normais de inicialização.

Um failover alternativo pode ser realizado via sistema de monitoramento. Quando detecta o host inativo, ele pode usar o VMware Remote CLI para emitir um desligamento (por segurança) e, em seguida, ligar o backup da VM. Nesta situação, o retorno é razoavelmente manual.

No meu ambiente "pequeno", não vi um VMDK corrompido. O que percebi também é que, se você tiver mais de 2 hosts ESX (i) ou uma dúzia de VMs, precisará do vCenter para ajudar a acompanhar tudo. Alguns dos pacotes Essential / Plus não são muito caros, considerando os benefícios.

Jeff Hengesbach
fonte
1

Matt, você sabe que eu não uso o VMware, mas sempre usei "RAW" com o Xen. Com apenas algumas VMs levemente carregadas, duvido que você veja muita diferença de desempenho. Mas quando você começa a receber mais e mais convidados, se todos estiverem no mesmo sistema de arquivos, você terá problemas de profundidade da fila. Isto é especialmente verdade no armazenamento suportado pelo NFS. Não é tanto que o servidor NFS tenha os problemas, mas a maioria das implementações de clientes NFS é péssima.

Não conheço uma boa maneira de sincronizar os vmdks se você estiver procurando por redundância (falha de sanidade). Mas se você usa dispositivos de bloco, ainda tem a possibilidade de usar o DRBD para replicar apenas os vms que deseja / precisa ser replicado.

Nick Anderson
fonte
0

Eu acho que você deveria se perguntar "Eu planejo voltar para servidores físicos"

Se a resposta for talvez, talvez você deva seguir o RDM. O ESXi com RDM (acho) exigiria que você compre algo para que sua fibra funcione (novamente sem ter 100% de certeza sobre o esxi).

Tínhamos várias máquinas que acabei de mover rapidamente de servidores físicos para o ESX (4.0) usando RDM. Eu tinha uma mistura de máquinas Linux e Windows (super fácil para ambas as plataformas). Ainda temos alguns FreeBSD legados em execução (6.0 e mais antigos) em servidores físicos para os quais não podemos usar o RDM, porque o kernel do FBSD antigo não suporta isso. Foi rápido e exigiu que eu não fizesse nada além de apontar meu LUN e instalar as ferramentas do VMWare. Cérebro morto fácil .. sem conversor sem problemas ...

Outra coisa que você deve se perguntar é "Quais recursos do VMWare eu quero usar?"

Dependendo da sua resposta, talvez você não tenha outra escolha além do VMDK. Se você usa sua SAN para capturas instantâneas e não se preocupa em usar o vmware, por exemplo.

Algumas notas que eu compartilharei com você sobre o que encontramos até agora .. O Vmotion funciona igualmente bem com RDM e VMDK, o Storage Vmotion, por outro lado, funciona corretamente corretamente com não RDM, e tentar usar o armazenamento Vmotion para ir do RDM para o VMDK é uma porcaria. basta usar o conversor. A maioria das distribuições Linux possui um pacote de ferramentas vmware de código aberto, o que torna a instalação de ferramentas um problema. O aplicativo de backup funciona muito bem e é livre de vmware, mas não faz o material que gostaríamos. Eu recomendo ter uma aula de vmware. O que eu tirei foi uma semana e valeu a pena cada centavo de suporte do VMWare é incrível .. Se você obtiver um contrato de suporte e precisar ligar para eles, não é o melhor .. Fico frustrado ao encontrar alguém que possa me ajudar (em muitos menus .. ), mas quando os recebo, eles SEMPRE vêm com um suporte rápido e confiável.

errr_
fonte
Obrigado. O treinamento é uma boa sugestão, eu acho, mas não há como pagar pelas licenças para usar coisas como vmotion, então não tenho certeza do que eu poderia levar para casa a partir da sessão de treinamento.
Matt Simmons