Posso executar de maneira confiável com uma única placa Fusion-io instalada em um servidor ou preciso implantar duas placas em uma configuração de RAID de software?
O Fusion-io não é muito claro (quase enganoso) sobre o tópico ao revisar seus materiais de marketing Dado o custo dos cartões, estou curioso para saber como outros engenheiros os implantam em cenários do mundo real.
Pretendo usar a placa Fusion-io ioDrive2 de 1,2 TB da marca HP para uma solução de banco de dados independente proprietária em execução no Linux. Esta é uma configuração de servidor único sem opção de alta disponibilidade real. Não é replicação assíncrona com a 10 minutos RPO que os espelhos registos de transacções para um segundo servidor físico.
Tradicionalmente, eu especificava um servidor HP ProLiant de última geração com as principais etapas da CPU para este aplicativo. Preciso ir para o SSD e adquirir o Fusion-io por um preço mais baixo que o SSD SAS da empresa para a capacidade necessária.
- Preciso executar duas placas ioDrive2 e associá-las ao software RAID (md ou ZFS), ou isso é desnecessário?
- Devo me preocupar com a falha do Fusion-io mais do que com uma falha no controlador RAID ou na placa mãe?
- Administradores de sistema como RAID. Isso requer uma mentalidade diferente, dada a interface diferente e o nivelamento / correção de erros no cartão disponíveis neste fator de forma?
- Qual é a taxa de falha desses dispositivos?
Edit: Acabei de ler um whitepaper de confiabilidade do Fusion-io da Dell, e o que parece ser "As placas Fusion-io têm muitas redundâncias internas ... Não se preocupe com o RAID !!" .
Respostas:
Em última análise, tudo se resume ao seu modelo de falha. Qual é o impacto de uma falha?
Historicamente, sempre controlamos tudo, pois o custo de fazer isso é insignificante. Mais US $ 500 por uma unidade de espelhamento? Totalmente vale o custo, sem sequer considerar.
Quando você está falando de mais US $ 10.000 para ativar o espelhamento, ele precisa de um pouco mais de consideração.
Não, você não precisa espelhar
As placas Fusion-io possuem redundância interna bastante boa. Esse não é o tipo de hardware em que seu disco é um único chip. Na maioria das situações em que observei falhas, tem sido um problema de firmware que afetou os dois membros de um espelho, portanto o RAID não teria importância.
Pense em uma placa Fusion-io como um controlador RAID com discos atrás dela. Você está bem com uma configuração de controlador único? Provavelmente. Trate assim.
Em muitas configurações nas quais você implantaria unidades Fusion-io, você terá outras salvaguardas incorporadas (redundância no nível do nó) para que não faça tanto sentido.
Sim, você precisa espelhar
O RAID aumenta sua disponibilidade . Você precisa de disponibilidade máxima absoluta, apesar do custo? O custo de uma falha e o possível tempo de inatividade são caros? Vá em frente e espelhe as unidades. Em uma configuração estatisticamente grande, você terá falhas nas unidades, apesar das salvaguardas internas.
fonte
A redundância no dispositivo deve fazer o trabalho muito bem para falhas dos chips flash - análogo ao RAID entre todos os componentes que fazem o armazenamento de dados real.
Uma falha de todo o dispositivo seria praticamente análoga à perda de um controlador RAID ou placa-mãe - eu ficaria quase tão preocupado com a placa Fusion-io quanto com esses outros componentes de ponto único de falha, embora eu não não possui experiência com os dispositivos em larga escala para poder comparar as taxas de falha usando dados físicos.
Adicionar redundância além do que o dispositivo já possui (por exemplo, RAID de software entre várias placas Fusion-io) seria como fazer RAID de software entre dois grupos RAID de hardware em dois controladores RAID diferentes; pode valer a pena para sistemas que exijam extrema redundância para remover um único ponto de falha adicional, mas não para implantações comuns (um RPO de 10 minutos em um espelho deve ser bom o suficiente para a maioria dos aplicativos?).
Sim, acho que sim. Você está basicamente adquirindo um dispositivo que é como um controlador RAID e vários dispositivos de armazenamento em um único pacote. Definitivamente, é tentador se preocupar em colocar seus dados confidenciais em um único dispositivo, mas é preciso ter algum nível de confiança na redundância interna do dispositivo ... O que deve ser contrabalançado com uma compreensão saudável do "RAID não é um conceito de backup ": esteja sempre preparado para a falha de um componente redundante ou para um usuário excluir os dados nele, com bons backups.
fonte
Como você sabe, usamos o kit por um tempo, nas configurações de RAID e não-RAID - eu gostaria de ter alguma experiência com falha para fornecer a você, mas não tenho. Não tivemos falhas com as quais o RAID ajudaria e seus recursos de resiliência a bordo estão apenas melhorando. Além disso, a principal função para a qual os usamos é agora escalada / agrupada horizontalmente agora, portanto, temos ainda menos motivos para RAID-los. Excelentes cartões, recomendo-os.
fonte
Não estou familiarizado com o Fusion diretamente, mas tenho alguma experiência com PCIe SSD para trabalhar.
As pessoas com quem trabalho apresentam quatro LUNs diferentes para o sistema operacional e tratam a placa PCIe como um HBA. Se eu quiser RAID, espelhar dois LUNs juntos usando o sistema operacional. Isso me permite uma solução de cartão único para redundância. No entanto, se o cartão falhar, ainda estou em um riacho. Não sei se o ioDrive faz a mesma coisa.
fonte
Comprei 6 dos cartões de 1,2 TB nos últimos dois meses. Um deles já falhou. Então eu absolutamente os atacaria. Eu usei o espelho de disco ativo do Windows. A unidade falhou com a mensagem "ausente mapa LEB". Foi-me dito que precisaria ser trocado. Mas, para obter a aprovação da RMA, eu precisaria tirar fotos nos dois lados do cartão com falha (exigindo uma interrupção na produção para retirar o cartão). E então eles me disseram que o cartão de substituição estava esgotado sem eta. Então, você pode pensar bastante antes de comprá-los.
fonte