Zip, Rar, 7z, Gzip, BZip2, Tar etc. Estou ouvindo que 7z é o sabor do mês, por quê? É melhor para todas as situações ou existem melhores opções para situações específicas.
Ou talvez o arquivador de arquivos real, ou seja, WinZip, WinRar, 7Zip etc (em oposição ao formato), tenha um efeito maior?
Em sua resposta, você poderia descrever que tipo de compensação de velocidade / compactação seu formato mencionado usa.
Forneça links para todos os testes empíricos que apoiam sua resposta.
Antecedentes: preciso fazer backup de um índice de pesquisa personalizado que crie cerca de 3000 arquivos relativamente pequenos (menos de 10 MB), cada um contendo muitos dados repetitivos.
(Como de costume, a Wikipedia possui um artigo relevante, mas a seção sobre comparação de desempenho é breve.)
obrigado
fonte
Leitura recomendada:
Compactação de arquivos na era de vários núcleos (Jeff Atwood aka CodingHorror, fevereiro de 2009)
E sobre algoritmos:
fonte
Não se trata de eficiência e velocidade. Claro que eles são importantes e você pode examinar os parâmetros de referência para eles e escolher sabiamente dentre as opções (embora eu recomende alguns testes simples de referência com seus próprios dados em seu próprio servidor). Mas o arquivamento inevitavelmente leva, em algum momento, a acessar seus dados novamente (caso contrário, por que não excluí-los?). Ou talvez anos depois, não será você que acessará os dados, mas sim alguém terceiro. Escolha algo que estará disponível quando você precisar acessar os dados e algo que as pessoas reconheçam. Eu pessoalmente uso o 7zip, mas quando eu arquivo arquivos outras pessoas podem precisar, eu uso o zip. Eles sabem disso, muitas ferramentas podem lidar com isso. Pode não ser tão rápido ou tão pequeno, mas ajuda no fator humano.
fonte
O lzma parece ter um desempenho muito bom tanto na taxa de compressão quanto na velocidade.
Nos benchmarks a seguir http://tukaani.org/lzma/benchmarks, a configuração mais rápida para lzma proporcionou tempos de compactação consideravelmente mais rápidos que a opção mais rápida do bzip2, enquanto ainda oferece uma compactação melhor que a opção mais lenta do bzip2:
Ele funciona especialmente bem com dados binários, mas acho que li alguns benchmarks de texto sem formatação em que o bzip2 o superou.
Vale a pena ler a página de manual do lzma:
fonte
Dê uma olhada nesta entrada da Wikipedia . Para o fundo, "Comparação de eficiência". Isso fornecerá a porcentagem de compactação e o tempo gasto, aproximadamente. Todos esses números variam (velocidade) com base na velocidade da máquina utilizada, na quantidade de memória, etc.
Mais benchmarks de compactação:
fonte
Comparando zip, 7z, rar com dois casos
Depende do que exatamente você está compactando, mas, em geral, o 7z faz melhor uso de vários processadores, e o próprio formato de compressão 7z produz uma compressão maior que o zip e, às vezes, maior que rar (embora rar e 7z sejam quase equivalentes, mas rar isn é grátis ...)
Meus testes, há alguns meses atrás, deram os seguintes resultados:
Compactando um único arquivo de banco de dados de acesso de 10 MB:
A compactação de uma pasta que contém mais de nove mil arquivos de tipos variados (903.488 KB) e obteve o seguinte (esta é uma combinação do código-fonte e de todas as ferramentas que o envolvem para o desenvolvimento do software):
Para fins de tempo, era um Core2 Duo, 2 GHz, 1 GB de RAM e um disco rígido barato.
Portanto, o 7z deu uma melhora substancial na taxa de compressão nos dois casos que testei acima e além do zip, e até melhorou no rar, mas o 7z foi certamente mais lento. Não significativamente, mas o suficiente para ser observado.
-Adão
fonte
Acabei de instalar o dar (mas ainda não tive a chance de jogar com ele). É semelhante ao tar com compressão gzip ou bzip2, com a capacidade adicional de dividir o arquivo morto em várias partes e calcular a paridade para que, se uma ou mais partes estiverem corrompidas, ela possa ser reconstruída a partir dos arquivos de paridade.
fonte