Qual a eficácia das camadas de armazenamento SSD do LSI CacheCade?

22

A LSI oferece sua tecnologia de armazenamento em cache CacheCade , que permite que dispositivos SSD sejam usados ​​como caches de leitura e gravação para aumentar as matrizes RAID tradicionais.

Outros fornecedores adotaram tecnologias semelhantes; Os controladores HP SmartArray possuem seu SmartCache . A Adaptec possui o MaxCache ... Sem mencionar várias ferramentas de aceleração baseadas em software ( sTec EnhanceIO , Velobit , FusionIO ioTurbine , Intel CAS , Facebook flashcache ?) .

Vindo de um background do ZFS , utilizo diferentes tipos de SSDs para lidar com tarefas de cache de leitura (L2ARC) e de gravação em cache (ZIL). Características diferentes são necessárias para suas respectivas cargas de trabalho; Baixa latência e resistência para cache de gravação. Alta capacidade de leitura.

  • Como os SSDs CacheCade podem ser usados ​​para cache de gravação e leitura, qual é a finalidade da NVRAM integrada do controlador RAID?
  • Quando usado como um cache de gravação, que perigo existe para os SSDs CacheCade em termos de resistência à gravação? O uso de SSDs de consumo parece ser incentivado.
  • As gravações vão diretamente para o SSD ou atingem o cache do controlador primeiro?
  • Quão inteligente é o algoritmo de cache de leitura? Entendo como o ZFS ARC e o L2ARC funcionam . Existe algum insight sobre o processo de camadas do CacheCade?
  • Quais métricas existem para monitorar a eficácia da configuração do CacheCade? Existe um método para observar uma taxa de acertos ou porcentagem de cache ? Como você pode dizer se está realmente funcionando?

Estou interessado em opiniões e comentários sobre a solução LSI. Alguma ressalva? Dicas?

ewwhite
fonte
2
Adaptec tem o mesmo. MUITO boa pergunta.
TomTom

Respostas:

9

Como os SSDs CacheCade podem ser usados ​​para cache de gravação e leitura, qual é a finalidade da NVRAM integrada do controlador RAID?

Se você deixar o recurso de cache de gravação do controlador ativado, a NVRAM ainda será usada principalmente. O cache de gravação SSD normalmente será usado apenas para grandes quantidades de dados de gravação, onde a NVRAM sozinha não é suficiente para acompanhar.

Quando usado como um cache de gravação, que perigo existe para os SSDs do CacheCade em termos de resistência à gravação? O uso de SSDs de consumo parece ser incentivado.

Isso depende da frequência com que suas gravações estão realmente fazendo com que o cache de gravação SSD seja necessário ... se suas unidades conseguem ou não lidar com a carga de gravação com rapidez suficiente para que a NVRAM não seja preenchida. Na maioria dos cenários que eu já vi, o cache de gravação recebe pouca ou nenhuma ação na maioria das vezes, portanto, eu não esperaria que isso tivesse um grande impacto na durabilidade da gravação - a maioria das gravações nos SSDs provavelmente fará parte de sua leitura cache.

As gravações vão diretamente para o SSD ou atingem o cache do controlador primeiro?

Respondida acima ... O cache do controlador é atingido primeiro, o cache SSD é mais uma segunda linha de defesa.

Quão inteligente é o algoritmo de cache de leitura? Entendo como o ZFS ARC e o L2ARC funcionam. Existe algum insight sobre o processo de camadas do CacheCade?

Desculpe ... nenhum conhecimento para contribuir com isso - espero que alguém tenha alguma ideia?

Quais métricas existem para monitorar a eficácia da configuração do CacheCade? Existe um método para observar uma taxa de acertos ou porcentagem de cache? Como você pode saber se está funcionando?

Não parece que nenhuma ferramenta de monitoramento esteja disponível para isso, como ocorre com outras implementações de SAN desse conjunto de recursos ... E como o disco virtual CacheCade não é apresentado ao sistema operacional, talvez você não tenha como manualmente monitorar a atividade também. Isso pode exigir apenas mais testes para verificar a eficácia ...

Opinião / observação: Em muitos casos (quando usado corretamente, o cache de leitura é dimensionado adequadamente para o conjunto de dados de trabalho), esse recurso faz com que as coisas voem. Mas, no final, pode ser um sucesso.

JimNim
fonte
1
Ei, só queria acrescentar que pode haver algumas métricas disponíveis no sistema operacional, na página 220 do manual, falando sobre as opções do MegaCLI (que podem ser instaladas no Linux, Windows, Unix, Bsd, etc). Ele diz:Convention MegaCli -perfmon -start -interval <val> -aN Description -perfmon: Specifies collection of performance data. The possible parameters are: -start: Starts the performance data collection. -interval: the time interval (in minutes) that you specified for which you want the performance data collection. The default value is 5 minutes
NickW
Hmmm, não muito detalhado. Eu teria que ver como é o formato da coleção.
ewwhite
Eu estaria interessado em ver os dados que é recolhido / relatado pelo que se os testes de ninguém que fora ...
JimNim
1

Falando sobre soluções de hardware, não encontrei maneira de saber a taxa exata de acertos ou algo assim. Acredito que há duas razões para isso: o volume por trás do controlador aparece como uma única unidade (e, portanto, deve "funcionar"), e é difícil contar "hits" que não serão para arquivos, mas para os setores de HDD. pode haver alguma taxa de acerto, mesmo no disco rígido vazio, o que pode ser confuso. Além disso, os algoritmos por trás da "hibridização" não são públicos, portanto, conhecer o hitrate não ajudará muito. Você apenas compra e coloca em funcionamento - baixos gastos (em comparação com a solução SSD pura), bom impacto na velocidade.

A abordagem "compre e use" é uma coisa muito boa a considerar, mas ninguém sabe ao certo como criar a combinação mais rápida: devemos usar vários discos rígidos grandes e vários SSDs de cache grande ou usar muitos discos rígidos pequenos e vários SSDs grandes etc., e qual é a diferença entre 100 ou, digamos, 500 Gb ou 2000 Gb de cache SSD (até 500 parece um exagero se os dados de volume do volume forem pequenos) e deve ser 2x64Gb ou 8x8Gb para transferência de dados paralelo. Novamente, cada fornecedor usa seu próprio algoritmo e pode alterá-lo na próxima atualização de firmware.

Escrevo isso principalmente para dizer que minhas descobertas me deram uma resposta estranha: se você usa algum servidor de uso geral e com perfil de carga geral, o controlador híbrido h / w fica bem mesmo com SSDs relativamente pequenos, mas se suas tarefas costumavam ser É melhor optar por uma solução s / w específica (que você poderá escolher, pois é o único que conhece o perfil de carga) ou para alguns armazenamentos de placas PCI de alto preço.

Alexander
fonte
1

Aqui estão algumas reivindicações da Dell:

Desempenho de armazenamento - E / S por segundo (IOPS):

  • O CacheCade forneceu um aumento de 3x mais IOPS do que apenas o armazenamento no disco rígido
  • O armazenamento SSD SAS alcançou 8x mais IOPS do que o armazenamento HDD
  • Uma unidade Express Flash resultou em 10,5x mais IOPS do que 16 HDDs

Em termos de IOPS, seus números parecem estar no mesmo nível. Costumo manter os relatórios do DiskSpd de vários servidores e, se eu escalar um dos relatórios que tenho para a contagem de eixos-árvore que tenho no servidor de cacheecade, devo obter apenas 750k IOPS. No entanto, ao testar esse servidor, eu estava ultrapassando os 2 milhões. Foi realmente a única vez que vi a carga da CPU como um fator pelos threads do diskspd começarem a ser um fator. Normalmente, a CPU ainda é mínima quando o disco começa a fechar, mas esse não foi o caso aqui. Estou me chutando por não executar o disco com e sem mas bem.

O outro fator aqui é que é totalmente transparente ... gaste algumas centenas de dólares em um ssd de classe empresarial menor, adicione-o como um volume de cache cache e pronto. Se você tem dinheiro para gastar com armazenamento all-ssd, isso não importa, mas para dar vida a eixos físicos, considero que vale a pena.

b_levitt
fonte
0

Eu tentei no Dell R515 com Dell PERC H700 Raid com 1 GB de memória com SSDs de 500 MB / s

Fiz minha marcação no banco algumas horas após a instalação e após 48 horas

Não vi muitas melhorias na velocidade de gravação, uma pequena melhoria no Read, fiz o teste há um tempo atrás e não tenho números agora.

Mas não foi significativo e acabei usando a caixa de armazenamento sem esse recurso.

Pela minha experiência, a maioria desses softwares é apenas uma piada! se você precisar de níveis de armazenamento, crie seu próprio, obtenha hardware confiável da Dell e encha a caixa com SSDs

No meu local de trabalho, as camadas de armazenamento funcionam muito bem com o HP 3Par e o complemento de otimização adaptável, ele funciona como anunciado, mas esta solução é de cerca de 100 mil :)

user1007727
fonte
11
Eu não acho que colocar um cache SSD na frente de SSDs iria ajudar em tudo :)
Michael Hampton