Estou wget
usando arquivos enormes (acima de 100 GB) e depois comparando meu md5sum com a soma postada no repositório. Acredite ou não, md5sum
leva um tempo não trivial para ser executado em um arquivo desse tamanho, então eu gostaria de obter a soma em paralelo com o download.
Qual é a melhor forma de fazer isso? Não vejo uma wget
opção para calcular o MD5 durante o download (surpreendentemente), então acho que usar tee
seria o caminho a seguir ?!
Respostas:
Na verdade, isso pode ser possível:
No entanto, isso pressupõe que você tenha o hash em um arquivo anteriormente.
fonte
md5sum
(e qualquer outro algoritmo de hash comum, como a família SHA) opera na memória constante. Eles são projetados para trabalhar em fluxos.awk
no final, você pode remover o `-`a final automaticamente.wget -O - "https://example.org/myFile.jpg" | tee file | md5sum | awk '{print $1}' > md5.txt