Amazon, Facebook e Google devem receber TBs, se não PBs por dia, o que significa que eles têm pessoas instalando continuamente novos discos rígidos e cabos em novos racks da mesma maneira que você pode criar um servidor comum ou há uma tecnologia diferente usada para conectar unidades em massa?
hard-drive
scaling
jl6
fonte
fonte
Respostas:
Não sei se algum deles está realmente instalando hardware, um servidor por vez. Em 2008, a MS começou a construir seus datacenters, entregando servidores em contêineres selados e pré-cabeados de servidores que eles só precisavam descarregar de um caminhão e conectar as conexões de energia / rede. Embora a versão 08 tenha sido uma mistura de contêineres e tradicional para o datacenter mais recente, eles adotaram um design pré-fabricado personalizado à prova de intempéries e não precisa ser alojado em prédios separados.
Tanto a HP quanto a IBM vendem pacotes semelhantes com contêineres pré-construídos, cheios de servidores que precisam apenas de conexões de energia / dados para implantar.
fonte
O Google possui várias tecnologias que eles desenvolveram internamente para armazenar essas enormes massas de dados. Usando essas tecnologias, eles podem realmente adicionar cargas de caminhões de discos rígidos ao cluster sem tempo de inatividade, mas sim, eles ainda precisam de pessoas fazendo isso.
Tanto quanto sei no blog do Google, as duas partes principais são o sistema de arquivos do Google, que é um sistema de arquivos distribuído que pode ser dimensionado para uma escala realmente grande: sistema de arquivos do Google
E no topo do sistema de arquivos do Google, eles têm o Big Table, que é algum tipo de banco de dados de valor-chave e também se transforma em enormes escalas: Big Table
Para garantir alta disponibilidade, tudo é redundante muitas vezes, mais de 3 vezes na maioria dos casos.
fonte
Isso é precisamente correto. Lembro-me de que, ao mesmo tempo, os datacenters do Facebook adicionavam três reboques de tratores cheios de discos rígidos e servidores montados em rack em um dia normal. Obviamente, eles têm esquemas complicados para tornar o armazenamento escalável e redundante. O Google, por exemplo, possui GFS . O Facebook possui três centros de dados apenas para seus equipamentos, cada um maior que dois Wal-Marts e um novo planejado quatro vezes maior que seus centros existentes.
fonte
Com as soluções de armazenamento Open Compute de nova geração capazes de caber 180 TB de disco em 4 unidades de rack, um PB não é realmente uma quantidade enorme de espaço: adicionar 1PB por dia significaria acumular 5 desses servidores por dia, não um grande problema. Melhor ainda, eles podem ser adquiridos por cerca de US $ 10 mil, o que significa que você está pagando menos de US $ 60 por TB.
Então, sim, a tecnologia está disponível para todos nós fazermos o mesmo, a um preço que não custa muito.
Mas você deve ter em mente que as empresas maiores sempre conseguem um acordo melhor e assinam grandes contratos para adquirir grandes quantidades de armazenamento. Eles podem receber pequenas remessas espalhadas ao longo do ano, mas não é como se eles pedissem apenas 1 PB por vez.
fonte
Aqui está um post interessante do BackBlaze sobre como eles fazem isso (eles provavelmente não precisam de tantos discos quanto o Google ou o Facebook, mas ainda assim todo), e o que eles precisavam fazer quando houvesse inundações na Tailândia que tornavam o disco rígido caro e mais difícil de obter:
http://blog.backblaze.com/2012/10/09/backblaze_drive_farming/
fonte