Como a versão do dropbox / carrega arquivos grandes? [fechadas]

28

Eu tenho uma conta de caixa de depósito gratuita (2 GB) e fiquei imaginando como funciona a versão de arquivos grandes.

Eu tenho um backup completo de todos os meus arquivos da web em sites com pouco mais de 1 GB. Após o upload inicial de 1 GB, sempre que sincronizar, o dropbox descobrirá o delta do arquivo ou será necessário fazer o upload do arquivo inteiro novamente para a versão?

Seria legal ter sempre uma versão atualizada de um arquivo grande, mas não quero matar minha largura de banda carregando 1 GB sempre.

Isso é possível?

Obrigado,

barfoon
fonte

Respostas:

36

O Dropbox usa um algoritmo diff binário para dividir todos os arquivos em blocos e fazer upload apenas dos blocos que ele ainda não possui na nuvem. Tudo isso é feito localmente no seu computador.

O Dropbox não utiliza apenas os arquivos dos quais você já enviou, agrega os arquivos de todos em um banco de dados de blocos e verifica cada hash do bloco local nesse banco de dados.

Isso significa que, se outra pessoa fez o upload do mesmo arquivo (por exemplo, a última ISO do Ubuntu), o upload parecerá instantâneo, pois não há nada a fazer, mas se você estiver atualizando um arquivo que muda regularmente, como o seu arquivo de backup, somente as alterações são carregadas. Se você enviar um arquivo totalmente exclusivo, precisará aguardar o upload de tudo.

Moo
fonte
4
Alguma referência a isso? É muito interessante
STW
1
A equipe do Dropbox fala sobre isso de vez em quando nos fóruns (especialmente no Arash F, embora estejam muito ocupados hoje em dia).
Moo
3
Isso significa que apenas seria feito o upload de blocos alterados de um arquivo criptografado (por exemplo, um volume TrueCrypt)?
Will M
1
Will - sim, acredito que muitas pessoas usam o TrueCrypt dentro de suas pastas do Dropbox com grande sucesso.
Moo
1
A última parte da sua resposta não é mais verdadeira. Após o desastre do 'Dropship', foram feitas alterações. É provável que eles ainda desapareçam internamente, mas se você colocar o "windows8.iso" (o que, provavelmente, pelo menos alguém já o fez) na sua pasta agora, será necessário fazer o upload de todos os bytes.
DanO
10

Para o que vale, o Dropbox alega criar hashes a cada 4 MB de cada arquivo. Dessa forma, se você alterar 2 MB contíguos de um arquivo de 100 MB, provavelmente será necessário fazer upload de 4 MB (ou 8 MB se você passar para um segundo bloco de 4 MB) para sincronizar novamente o arquivo.

Os hashes que usamos são apenas para os blocos de arquivos de 4 MB

Fonte: https://blogs.dropbox.com/tech/2016/05/inside-the-magic-pocket/

mightytightywty
fonte
não está claro, porém, se os 4 MB são anteriores ou posteriores à compactação e outras operações
Walter Tross em
2

Também é importante destacar que ele não carrega o arquivo inteiro de uma só vez quando você o altera. Por exemplo, se você tiver um arquivo único com 2 GB, digamos que você tenha uma unidade de disco criptografada (como quando você usa truecrypt ou pgpdisk) e altera apenas alguns arquivos dentro do disco criptografado, o dropbox fará o upload apenas dos blocos que mudou efetivamente. Então, por exemplo, se você fizer o upload do seu arquivo pgpdisk com 2 GB para o dropbox e alterar apenas digamos 100 MB desses 2 GB, o dropbox será inteligente o suficiente para detectar e atualizar apenas o que mudou . Portanto, você não desperdiça sua largura de banda de upload que já está lá.

Outro recurso em que vi a equipe da caixa de depósito está trabalhando é criar o caixa de depósito para detectar outras instâncias do caixa de depósito em execução na rede local e sincronizar as informações entre elas. Por exemplo, você tem um laptop e uma área de trabalho, e ambos têm a mesma conta da caixa de depósito e atualiza seus arquivos na área de trabalho - e a área de trabalho é sincronizada instantaneamente com a "nuvem" - quando você conecta seu laptop, em vez de ir para Na nuvem, o dropbox fará o download do diff diretamente do seu computador desktop e não desperdiçará sua largura de banda de download. Isso ainda está por vir - mas será um recurso interessante!

Macaubas
fonte
1
Eles lançaram uma compilação experimental com capacidade de sincronização ponto a ponto no fim de semana.
Moo
1
Agora é um recurso estável.
Wiliam