Com relação ao IOPS, vi várias fontes na Web que sugerem que o IOPS de um determinado número de discos é simplesmente o IOPS de um único disco multiplicado pelo número de discos.
Se meu entendimento de IOPS estiver correto (e não tenho certeza de que esteja), eu teria pensado que a realidade dependeria - entre muitos outros fatores - do nível RAID. Com o RAID 1/10, todos os dados são duplicados em pelo menos dois discos, reduzindo a contenção em um disco específico para alguns padrões de E / S. No entanto, em níveis RAID distribuídos, como RAID 0/5/6, os dados são distribuídos em vez de duplicados, o que significa que solicitações de leitura consecutivas podem ser para o mesmo eixo-árvore, levando ao bloqueio enquanto a E / S anterior é concluída. As gravações são ainda mais disputadas.
Devo acrescentar que aprecio a realidade é muito mais complexa devido a várias otimizações e outros fatores. Minha pergunta é realmente apenas saber se, em um nível muito básico, meu entendimento do que significa IOPS está no caminho certo. Pode ser que minha afirmação de que o IOPS possa até ser influenciada pelos níveis de RAID de tal maneira indique um mal-entendido básico do conceito.
fonte
Respostas:
Para o HDD , os IOPS geralmente são dominados pelo tempo de acesso do disco, que é a soma da latência de busca + atraso de rotação + atraso de transferência. Como essas variáveis dependem fortemente dos padrões de acesso e têm interações não óbvias com o layout RAID específico (por exemplo: tamanho da faixa) e o controlador (por exemplo: ajuste de leitura antecipada), qualquer resposta simples SERÁ ERRADA.
No entanto, vamos tentar ter uma figura aproximada. Em uma primeira aproximação, o IOPS garantido por uma matriz de n discos deve ser n vezes o IOPS de um único disco. No entanto, o nível de RAID e o padrão de acesso a dados , alterando o peso entre a latência de busca / rotação / transferência, mudam dramaticamente essa aproximação de primeira ordem.
Vamos dar alguns exemplos, assumindo 100 IOPS por discos únicos (um valor típico para discos de 7200 RPM) e matrizes de 4 discos (exceto RAID1, geralmente limitados apenas a 2 vias):
Deixe-me repetir: as opções acima são aproximações simples e quase quebradas. De qualquer forma, se você quiser jogar com uma calculadora RAID IOPS (severamente incompleta), dê uma olhada aqui .
Agora, volte para o mundo real. Nas cargas de trabalho do mundo real, o RAID10 é frequentemente a escolha mais rápida e preferida , mantendo alto desempenho mesmo diante de uma matriz degradada . O RAID5 e o RAID6 não devem ser usados em cargas de trabalho sensíveis ao desempenho, a menos que sejam centradas na leitura ou sequenciais por natureza. Vale a pena notar que os controladores RAID sérios têm um grande cache de write-back protegido contra perda de energia, principalmente para superar (pelo cache pesado de faixas) o baixo desempenho de gravação aleatória RAID5 / 6. Nunca use o RAID5 / 6 com controladores RAID sem cache , a menos que você realmente não se importe com a velocidade do array.
SSD são bestas diferentes, pensou. Como eles possuem um tempo médio de acesso muito menor, os RAIDs baseados em paridade geram uma sobrecarga de desempenho muito menor e são uma opção muito mais viável do que nos HDDs. No entanto, em uma pequena carga de trabalho centralizada de gravação aleatória, eu usaria uma configuração RAID10 de qualquer maneira.
fonte
É apenas uma questão de definições. Você pode medir o IOPS em diferentes níveis do sistema e obterá valores diferentes. Por exemplo, suponha que você tenha dois discos espelhados e esteja escrevendo o mais rápido possível. As IOPS enviadas para os discos terão o dobro do número de IOPS que um único disco pode suportar com uma carga de gravação semelhante. Mas o IOPS que entra no controlador será igual ao número de IOPS que um único disco pode suportar.
Geralmente, nos preocupamos com quantas IOPS lógicas podemos entrar na matriz e não nos importamos particularmente com o que está acontecendo no nível do disco. Nesse caso, você está correto e o IOPS depende do nível do RAID, do número de discos, do desempenho de cada disco e, em alguns casos, das características específicas das operações.
fonte