Preciso de cartões RAID Fusion-io?

27

Posso executar de maneira confiável com uma única placa Fusion-io instalada em um servidor ou preciso implantar duas placas em uma configuração de RAID de software?

O Fusion-io não é muito claro (quase enganoso) sobre o tópico ao revisar seus materiais de marketing Dado o custo dos cartões, estou curioso para saber como outros engenheiros os implantam em cenários do mundo real.

Pretendo usar a placa Fusion-io ioDrive2 de 1,2 TB da marca HP para uma solução de banco de dados independente proprietária em execução no Linux. Esta é uma configuração de servidor único sem opção de alta disponibilidade real. Não é replicação assíncrona com a 10 minutos RPO que os espelhos registos de transacções para um segundo servidor físico.

Tradicionalmente, eu especificava um servidor HP ProLiant de última geração com as principais etapas da CPU para este aplicativo. Preciso ir para o SSD e adquirir o Fusion-io por um preço mais baixo que o SSD SAS da empresa para a capacidade necessária.

  • Preciso executar duas placas ioDrive2 e associá-las ao software RAID (md ou ZFS), ou isso é desnecessário?
  • Devo me preocupar com a falha do Fusion-io mais do que com uma falha no controlador RAID ou na placa mãe?
  • Administradores de sistema como RAID. Isso requer uma mentalidade diferente, dada a interface diferente e o nivelamento / correção de erros no cartão disponíveis neste fator de forma?
  • Qual é a taxa de falha desses dispositivos?

Edit: Acabei de ler um whitepaper de confiabilidade do Fusion-io da Dell, e o que parece ser "As placas Fusion-io têm muitas redundâncias internas ... Não se preocupe com o RAID !!" .

ewwhite
fonte
A invasão de software e / ou o barramento PCIe conseguirá acompanhar se você estiver ultrapassando o limite de IOPS? Sinceramente, não faço ideia, mas vale a pena conferir.
21413
11
O barramento PCIe continuará. O RAID de software (se I NEED TO) será baseado em ZFS, por isso é capaz. Eu pedi dois cartões por enquanto, mas a literatura do Fusion-io parece dizer "um cartão é bom o suficiente".
ewwhite
Até o ZFS precisa usar ciclos da CPU para espelhar dados, para adicionar complexidade e latência - mas é impossível dizer o quanto isso afetaria seu aplicativo específico. Fusão parece ser muito orgulhosos do seu baixo custo de CPU no espelhamento interno / salvaguarda ..
pauska

Respostas:

16

Em última análise, tudo se resume ao seu modelo de falha. Qual é o impacto de uma falha?

Historicamente, sempre controlamos tudo, pois o custo de fazer isso é insignificante. Mais US $ 500 por uma unidade de espelhamento? Totalmente vale o custo, sem sequer considerar.

Quando você está falando de mais US $ 10.000 para ativar o espelhamento, ele precisa de um pouco mais de consideração.


Não, você não precisa espelhar

As placas Fusion-io possuem redundância interna bastante boa. Esse não é o tipo de hardware em que seu disco é um único chip. Na maioria das situações em que observei falhas, tem sido um problema de firmware que afetou os dois membros de um espelho, portanto o RAID não teria importância.

Pense em uma placa Fusion-io como um controlador RAID com discos atrás dela. Você está bem com uma configuração de controlador único? Provavelmente. Trate assim.

Em muitas configurações nas quais você implantaria unidades Fusion-io, você terá outras salvaguardas incorporadas (redundância no nível do nó) para que não faça tanto sentido.


Sim, você precisa espelhar

O RAID aumenta sua disponibilidade . Você precisa de disponibilidade máxima absoluta, apesar do custo? O custo de uma falha e o possível tempo de inatividade são caros? Vá em frente e espelhe as unidades. Em uma configuração estatisticamente grande, você terá falhas nas unidades, apesar das salvaguardas internas.

MikeyB
fonte
Atualização: eu espelhei as placas Fusion-io nas instalações em que o cliente estava bem com os gastos adicionais (e para facilitar a implantação do produto). Implantei várias instalações de placa única em outras situações. Tudo tem estado bem até agora ...
ewwhite 14/11
18

A redundância no dispositivo deve fazer o trabalho muito bem para falhas dos chips flash - análogo ao RAID entre todos os componentes que fazem o armazenamento de dados real.

Devo me preocupar com a falha do Fusion-io mais do que com uma falha no controlador RAID ou na placa mãe?

Uma falha de todo o dispositivo seria praticamente análoga à perda de um controlador RAID ou placa-mãe - eu ficaria quase tão preocupado com a placa Fusion-io quanto com esses outros componentes de ponto único de falha, embora eu não não possui experiência com os dispositivos em larga escala para poder comparar as taxas de falha usando dados físicos.

Preciso executar duas placas ioDrive2 e associá-las ao software RAID (md ou ZFS), ou isso é desnecessário?

Adicionar redundância além do que o dispositivo já possui (por exemplo, RAID de software entre várias placas Fusion-io) seria como fazer RAID de software entre dois grupos RAID de hardware em dois controladores RAID diferentes; pode valer a pena para sistemas que exijam extrema redundância para remover um único ponto de falha adicional, mas não para implantações comuns (um RPO de 10 minutos em um espelho deve ser bom o suficiente para a maioria dos aplicativos?).

Administradores de sistemas como RAID. Isso requer uma mentalidade diferente, dada a interface diferente e o nivelamento / correção de erros no cartão disponíveis neste fator de forma?

Sim, acho que sim. Você está basicamente adquirindo um dispositivo que é como um controlador RAID e vários dispositivos de armazenamento em um único pacote. Definitivamente, é tentador se preocupar em colocar seus dados confidenciais em um único dispositivo, mas é preciso ter algum nível de confiança na redundância interna do dispositivo ... O que deve ser contrabalançado com uma compreensão saudável do "RAID não é um conceito de backup ": esteja sempre preparado para a falha de um componente redundante ou para um usuário excluir os dados nele, com bons backups.

Shane Madden
fonte
13

Como você sabe, usamos o kit por um tempo, nas configurações de RAID e não-RAID - eu gostaria de ter alguma experiência com falha para fornecer a você, mas não tenho. Não tivemos falhas com as quais o RAID ajudaria e seus recursos de resiliência a bordo estão apenas melhorando. Além disso, a principal função para a qual os usamos é agora escalada / agrupada horizontalmente agora, portanto, temos ainda menos motivos para RAID-los. Excelentes cartões, recomendo-os.

Chopper3
fonte
Um bom ponto de dados. No entanto, não sei se a adição de uma camada RAID é um exagero ou não.
EJrite
11
Vejo que a tecnologia não é o ponto de definição aqui - seus dados precisam da capacidade de suportar a perda de uma única placa FusionIO ou não - pense neles como discos rápidos, dispendiosos e dispendiosos - que não mudam se você pode viver sem RAID ou não está certo?
Chopper3
Um pouco ... Uma abordagem tradicional seria usar SSDs SAS corporativos em um RAID 1 + 0. Isso é apenas a aplicação do mesmo padrão usado para girar discos nos SSDs. Mas isso também pressupõe hot-swap. Isso não se aplica a uma placa baseada em PCIe, especialmente quando eu seria forçado a usar o RAID de software para fazer isso. Como o Fusion-io também tem o benefício de um melhor nível de desgaste e monitoramento, estou tentando entender os modos de falha realistas envolvidos aqui. Trato o Fusion-io como um disco ou um controlador? Você não colocaria dois cartões Smart Array em um ProLiant para servir discos internos, certo?
ewwhite
2
@ewwhite Você pode ter dois controladores RAID com discos diferentes e RAID1 entre os discos dos controladores, se precisar lidar com a falha de um controlador RAID. Eu diria que trate a placa Fusion-io como um controlador RAID em termos de seu planejamento de redundância.
Shane Madden
@ewwhite Se você olhar para o texto que eu usei, poderá ler nas entrelinhas que tivemos uma interrupção em um único servidor equipado com FusionIO - tivemos um mobo pop - um DL580 G6 (temos muito poucos deles) e algo assim aconteceu com todo um banco de memória e tirou o quadro de quem. Nesse cenário, foi RAID 1'ed, mas obviamente isso não importava. Obviamente, lembre-se de que o PCIe pode ser hot-swappable, pode ser um problema enorme, mas pode funcionar bem.
Chopper3
9

Não estou familiarizado com o Fusion diretamente, mas tenho alguma experiência com PCIe SSD para trabalhar.

As pessoas com quem trabalho apresentam quatro LUNs diferentes para o sistema operacional e tratam a placa PCIe como um HBA. Se eu quiser RAID, espelhar dois LUNs juntos usando o sistema operacional. Isso me permite uma solução de cartão único para redundância. No entanto, se o cartão falhar, ainda estou em um riacho. Não sei se o ioDrive faz a mesma coisa.

sysadmin1138
fonte
Esta unidade em particular apresentará um dispositivo de bloco.
ewwhite
11
Os ioDrives apresentam um ou dois dispositivos independentes. Se apresentar dois, eles são fisicamente dois dispositivos separados em uma placa, cada um com sua própria proteção interna. Compare com, digamos, o Intel 910, que apresenta quatro dispositivos cada, que devem ser tratados como um SSD.
MikeyB
5

Comprei 6 dos cartões de 1,2 TB nos últimos dois meses. Um deles já falhou. Então eu absolutamente os atacaria. Eu usei o espelho de disco ativo do Windows. A unidade falhou com a mensagem "ausente mapa LEB". Foi-me dito que precisaria ser trocado. Mas, para obter a aprovação da RMA, eu precisaria tirar fotos nos dois lados do cartão com falha (exigindo uma interrupção na produção para retirar o cartão). E então eles me disseram que o cartão de substituição estava esgotado sem eta. Então, você pode pensar bastante antes de comprá-los.

user229000
fonte
Obrigado por compartilhar sua experiência. Fui em frente e implantei essas placas de 1,2 TB em pares espelhados. Estou usando os SKUs da HP, por isso tenho meu contrato de suporte HP para lidar com RMA / substituição.
ewwhite