Prática recomendada para a matriz de 24 discos

9

acabamos de migrar para nosso armazenamento SAN de fibra antigo para um IBM v3700 storwize com 24 discos SAS de 600 GB.

Esse armazenamento é conectado diretamente a dois servidores IBM ESXi 5.5, cada um com dois controladores SAS de caminhos múltiplos de 6Gbps.

Até agora, eu configurei o armazenamento que usei em vários grupos RAID5. Cada grupo seria para um servidor / finalidade diferente. Principalmente, os grupos RAID seriam OracleDB, arquivo Oracle, SQL Server e o restante (servidor de arquivos, correio, etc.). Os aplicativos mais críticos são Oracle e SQL Server.

Minha primeira preocupação é segurança e desempenho para nossas aplicações. Então, eu decidi usar RAID6 + de reposição.

Minha principal preocupação agora é que, como estamos usando o ESXi, devo configurar todo o armazenamento em um único RAID, economizando espaço e criar volumes de armazenamento de dados do ESXi para cada servidor ou isso não é uma boa prática e é melhor criar separadamente grupos RAID de hardware?

teo
fonte
4
Pessoas que estão votando para encerrar isso: esta não é uma pergunta baseada em opinião, é uma questão de práticas recomendadas. Há uma resposta do fornecedor, que é abordada no tópico serverfault.
22415 Basil Basil

Respostas:

7

Cada fornecedor tem suas próprias recomendações, então comece perguntando à IBM. Você pode abrir um ticket solicitando conselhos de configuração sem pagar por suporte adicional, geralmente. Quem ou quem vendeu para você pode.

Pesquisando brevemente, descobri este livro vermelho . Na página 212, é provável que você queira um ataque básico 6, o que significa 1 de reposição e uma unidade por meta de 12. Isso significa dois ataques, um de 12 e um de 11. Eu não recomendaria o ataque 10, porque você perde metade do seu capacidade. Isso evita a paridade, mas é algo com o qual você só precisa se preocupar com armazenamento interno ou low-end. Seu armazenamento ocultará a sobrecarga de paridade das substituições aleatórias atrás do cache. Minha loja usa o raid 6 exclusivamente por meio petabyte do VMWare 5.5, e tudo bem.

Você deve ler esse livro e entender como eles fazem mdiscos e piscinas. Você deseja criar um pool de faixas largas em todos os seus eixos, assim que seus grupos de ataque estiverem configurados.

Manjericão
fonte
4

Isenção de responsabilidade - isso é altamente baseado em opiniões e sinalizou a pergunta como tal, mas tentarei oferecer uma resposta, pois recentemente configurei quase exatamente a mesma configuração.

Duvido muito que qualquer tipo de banco de dados tenha bom desempenho em um array RAID5 ou 6. A maioria dos fornecedores está desencorajando ativamente (e até mesmo nos casos proibindo) o uso de níveis não-aninhados de RAID com base em paridade devido aos altos tempos de reconstrução, o que leva a um risco aumentado ou a um URE durante uma reconstrução.

Eu pessoalmente dividiria isso em dois grupos distintos - um RAID10 para sua carga de IO alta, como bancos de dados, e um RAID50 para o restante dos seus dados. Quantos discos você dedica para cada matriz depende da quantidade de dados que você precisa armazenar.

Por exemplo, para sua matriz de 24 discos, você pode perder dois discos para peças de reposição do gabinete e criar quatro extensões de 2 discos (total de 8 discos) para obter um RAID10 lógico de cerca de 2,4 TB. Isso deixa 14 discos para o seu RAID50, 7 discos por extensão e cerca de 7,2 TB de espaço disponível. É claro que você pode manipular o número de extensões, mas lembre-se de que os RAID10s precisam de múltiplos de 2.

Quanto aos datastores, isso realmente não faz muita diferença se você não estiver usando recursos sofisticados, como Storage vMotion e DRS, para embaralhar recursos.

Além disso, para esclarecer seu último parágrafo: mais discos menores geralmente são preferíveis a discos menores, devido ao tempo necessário para reconstruir um disco com falha e à carga colocada nos outros discos durante a reconstrução.

Craig Watson
fonte
Preciso concordar com você e seguir seu conselho para o RAID10 para o banco de dados. Não tenho certeza se o RAID50 é suportado na v3700, uma vez que vai para o RAID10. Isso é feito em uma configuração de dois estágios do gerenciador de armazenamento?
teo
6
Sua bandeira está incorreta - esta é uma pergunta específica com uma resposta específica e correta. Há um redbook da IBM que contém as informações solicitadas. Além disso, seu comentário sobre os ataques 5 e 6 está incorreto para o armazenamento corporativo. Os tempos de reconstrução em um raid de 600 GB de 12 unidades não são as reconstruções de várias semanas que você obtém em unidades de 7200 4 TB. Além disso, invasão 50 não existe nesta armazenamento, eles usam piscinas ampla listrado contendo extensões de vários grupos de incursão de ataque 5, 6 ou 10.
manjericão
1

Eu nunca iria para um RAID6, ou mesmo 5 para esse assunto para cargas de trabalho no estilo de banco de dados. Como eles são baseados em paridade, eles sofrem uma alta penalidade de gravação e os tempos de reconstrução podem ser ENORMES.

O RAID 10 oferece o melhor desempenho, você pode sobreviver a uma falha de cada lado da matriz e alocar um hot spare ou dois para garantir que a matriz recupere sua redundância rapidamente, caso uma unidade falhe.

Em termos de divisão e apresentação de armazenamento ... Eu costumo seguir um esquema de 1 LUN por grupo RAID, cada LUN contém vários discos de VM.

tomstephens89
fonte
3
Os tempos de reconstrução em um disco SAS de 600 GB não são enormes. Seu conselho é verdadeiro para o armazenamento local de 7200 RPM, não o armazenamento corporativo com um cache de gravação de controlador grande e eixos pequenos e rápidos. Além disso, no VMWare 5.5, são recomendados dois LUNs por armazenamento de dados e deve ser usada ampla faixa sempre que possível para fazer com que cada LUN tenha acesso ao desempenho subjacente de todos os eixos, não apenas de uma única matriz.
Basil
1
De qualquer maneira, o RAID baseado em paridade é lento em comparação com o strip & mirror (desempenho e reconstrução) e só precisa ser usado quando a capacidade é a preocupação, não IOPS e taxa de transferência.
precisa saber é o seguinte
4
O problema com RAID 5 reconstrói é menos o tempo que leva para completar, mas sim a quantidade de dados que precisa ser lido (ou seja: todos os dados dos discos sobreviventes) sem um único erro de leitura irrecuperável:
Hagen von Eitzen
1
Não estou recomendando o ataque 5, Hagen. Eu estou recomendando o RAID 6. E Tom, a pergunta afirma que eles têm 24 discos SAS de 600 GB. Nem uma grande variedade de grandes discos lentos, nem nenhum SSD (não importa o quão estabelecida a tecnologia). Esta questão é muito explícita e clara.
Basil
2
Taxas de erro irrecuperáveis ​​em unidades corporativas são tipicamente cem vezes melhores que os modelos de desktop. Essa preocupação com reconstruções não é particularmente significativa.
Sobrique