Alguma confusão por causa da minha pergunta, para simplificar:
"Que tipo de armazenamento os grandes provedores de nuvem usam e por quê?"
Pelo que entendi, no entanto, não consigo encontrar nenhum tipo de diferença oficial de rede de armazenamento entre datacenters e nuvens típicos, todos os provedores de nuvem estão usando DAS diferente dos datacenters típicos.
Mesmo o DAS tem muitas desvantagens do que o SAN ou o NAS. Quero saber os detalhes dos motivos pelos quais as nuvens usam o DAS para fins de armazenamento ou aplicativo.
Qualquer recurso ou descrição será apreciado para me esclarecer.
EDIT: Ao ler o artigo "Desafios de rede e abordagens resultantes para construção de nuvens em larga escala, David Bernstein e Erik Ludvigson (Cisco)", eles mencionam que,
Curiosamente, não vemos as nuvens dos principais provedores que usam NAS ou SAN. A arquitetura típica da nuvem usa o DAS, o que não é típico das abordagens de armazenamento do Datacenter.
Mas aqui há um conflito: na minha opinião e também declarado mais adiante neste documento, as nuvens devem usar SAN ou NAS por causa do DAS não é apropriado quando uma VM é movida para outro servidor, mas ainda precisa acessar o armazenamento do servidor original.
Quais são os outros motivos pelos quais as nuvens preferem DAS, NAS ou SAN? que tipo de armazenamento os grandes provedores de nuvem usam e por quê?
fonte
Respostas:
Esta resposta foi editada depois que a pergunta foi esclarecida.
Onde "DAS" significa armazenamento conectado direto, ou seja, unidades de disco rígido SATA ou SAS.
Todos os fornecedores de nuvem usam o DAS porque oferecem melhorias de preço / desempenho em ordem de magnitude. É um caso de dimensionamento horizontal .
Em resumo, unidades de disco rígido SATA e controladores SATA são mercadorias baratas. São produtos de mercado de massa e têm preços muito baixos. Ao criar um grande conjunto de PCs baratos com unidades SATA baratas, o Google, a Amazon e outros obtêm grande capacidade a um preço muito baixo. Eles então adicionam sua própria camada de software na parte superior. Seu software faz replicação multi-servidor para desempenho e confiabilidade, monitoramento, reequilíbrio da replicação após falha de hardware e outras coisas.
Você pode dar uma olhada no MogileFS como um representante mais simples do tipo de software que o Google, a Amazon e outros usam para armazenamento. É uma implementação diferente, é claro, mas compartilha muitos dos mesmos objetivos e soluções de design que os sistemas de grande escala. Se você quiser, aqui está um ponto de partida para aprender mais sobre o GoogleFS .
Existem 2 razões pelas quais as SANs não são usadas.
1) Preço. As SANs são extremamente caras em larga escala. Embora possam ser a melhor solução tecnicamente, geralmente não são usadas em instalações de grande escala devido ao custo.
2) O teorema da CAP Teorema da CAP de Eric Brewer mostra que em uma escala muito grande você não pode manter uma consistência forte, mantendo confiabilidade, tolerância a falhas e desempenho aceitáveis. As SANs são uma tentativa de obter forte consistência no hardware. Isso pode funcionar bem para uma instalação de 5.000 servidores, mas nunca foi comprovado que funcione para os mais de 250.000 servidores do Google.
Resultado: até agora, os fornecedores de computação em nuvem optaram por aumentar a complexidade da manutenção do estado do servidor para o desenvolvedor do aplicativo. As ofertas atuais da nuvem não fornecem um estado consistente para cada máquina virtual. Os servidores de aplicativos (máquinas virtuais) podem falhar e seus dados locais podem ser perdidos a qualquer momento.
Cada fornecedor tem sua própria implementação de armazenamento persistente, que você deve usar para dados importantes. As ofertas da Amazon são bons exemplos; MySQL , SimpleDB e Simple Storage Service . Essas ofertas refletem o teorema do CAP - a instância do MySQL tem uma consistência forte, mas uma escalabilidade limitada. O SimpleDB e o S3 são dimensionados de maneira fantástica, mas acabam sendo consistentes.
fonte
Se você usa o DAS, a disponibilidade é seu problema
Se eles usam DAS, a disponibilidade é problema deles. E se eles forem bons, eles usarão várias camadas de abstração para garantir que o problema deles não se torne o seu problema. Em vez de ficar indeciso sobre como eles escolhem montar seus discos no datacenter, o problema é se a disponibilidade que eles garantem no SLA é adequada ou não às suas necessidades. Ah, e o verdadeiro elefante na sala, o que você faz se eles saem do negócio (provavelmente não para alguns provedores, mas você ainda deve considerar) e o que você faz se usar esses dados localmente e sua conexão interweb for indisponível - o último é substancialmente mais provável do que a escolha do DAS, levando diretamente a uma interrupção.
fonte
Embora eu não tenha a resposta no DAS vs SAN / NAS ... Há muitas coisas a considerar ao procurar soluções de armazenamento.
A quantidade de dados? Se estivermos usando Gb, tudo bem, um NAS com um backup pode fazer o trabalho. Se houver terrabytes de dados, o preço aumenta muito rapidamente.
Eu acho que o preço é o principal fator ... se você tem uma SAN, precisa:
E ainda assim, você não tem redundância. Se você tiver acesso a um datacenter, as coisas podem ser diferentes.
Outra coisa a considerar é a acessibilidade. Você está arquivando? Se a acessibilidade não for um problema, algumas vezes por dia / semana / mês você arquiva na sua solução de armazenamento.
Se, por outro lado, você possui dados que precisam ser acessados constantemente, você encontra rapidamente um gargalo de largura de banda e limitação de hardware (como E / S). Mas, por outro lado, se você tiver uma grande quantidade de transferências com seus dados, há boas chances de uma solução de armazenamento on-line custar muito.
ROI (retorno do investimento) é o que todos os fornecedores de soluções de armazenamento on-line anunciam e geralmente têm razão, dependendo do uso, é claro.
Boa sorte.
fonte
(Apenas opinião e amplamente generalizada.)
A diferença é a camada de abstração que você está vendo (geralmente).
Os SAN / NAS geralmente fornecem um volume no qual você pode instalar um sistema de arquivos. O valor dessa abordagem para o sistema final é que você terceirizou os detalhes do hardware físico (por exemplo, nível RAID, localização física etc.).
Por outro lado, o armazenamento em nuvem geralmente fornece uma interface para um sistema de arquivos. A vantagem aqui é que você pode obter recursos de ordem superior gratuitamente (por exemplo, o Dropbox realiza versões automáticas de todos os arquivos de forma transparente).
fonte