Quais configurações usar ao criar arquivos 7zip para obter a compactação máxima ao compactar PDFs?

15

Quais configurações usar ao criar arquivos 7zip para obter a compressão máxima? Estou compactando documentos PDF contendo imagens digitalizadas. Estou pensando em usar o LZMA2, mas não sei o que definir no tamanho do dicionário, tamanho da palavra, etc. Além disso, o LZMA ou o PPMd seriam melhores opções?

Eu preciso ter alguns arquivos transferidos (~ 200MiB) pela rede e as velocidades de upload aqui são muito lentas, então eu gostaria de compactar os dados o máximo possível. O tempo de CPU consumido não é muito importante.

EDITAR

Aqui está o que obtive depois de testar vários métodos de compactação:

O tamanho não compactado era: 25.462.686B

Meu processador é o Intel Core 2 Due T8100 e tenho 4GiB de ram.

A melhor compactação foi com o PeaZip usando o algoritmo PAQ8O. O tamanho do arquivo resultante foi 19.994.325B. As configurações usadas foram o nível de compactação: máximo. Infelizmente, a velocidade de compactação ficou em torno de 5KiB / s, por isso demorou mais de uma hora para compactar os dados.

Em seguida foi o compressor PAQ9O experimental. Com ele, obtive 20.132.660B em cerca de 3 minutos de compactação. Infelizmente, o programa é apenas de linha de comando e muitos outros programas não usam esse algoritmo de compactação. Ele também usa cerca de 1,5 GiB de RAM com as configurações que eu usei (a -9 -c)

Depois disso, foi o 7-Zip 9.15 beta (20/06/2010) usando LZMA2. Usando-o, obtive 20.518.802B em cerca de 3 minutos. As configurações usadas foram tamanho de palavra 273, tamanho de dicionário de 64 MB e usei 2 threads para compactação.

Agora, voltando à minha pergunta original: no meu caso, o tamanho do bloco sólido não produziu nenhum resultado perceptível. O aumento do tamanho das palavras produziu alguns resultados. A diferença entre o maior tamanho de palavra e o menor foi de 115.260B. Acredito que essas economias justifiquem os esforços necessários para fazer dois cliques necessários e alterar o tamanho das palavras.

Tentei usar outros algoritmos de compactação suportados pelo 7zip e PeaZip e eles produzem arquivos em tamanhos de 19,8MiB a 21,5MiB.

No final, minha conclusão é que, ao compactar documentos PDF contendo principalmente imagens, o esforço necessário para usar algoritmos de compressão exóticos não se justifica. A compressão usando LZMA2 no 7zip produziu resultados bastante aceitáveis ​​em menos tempo.

AndrejaKo
fonte
O que há de diferente no uso do PeaZip? É apenas um invólucro da GUI em torno do 7zip e de muitas outras ferramentas
Cole Johnson
@Cole "Cole9" Johnson Bem, a diferença é que, no meu caso, usei algumas "outras" ferramentas do PeaZip que não tinham uma GUI na época. Se bem me lembro, então apenas o PeaZip ofereceu o algoritmo PAQ8O com uma GUI.
precisa saber é o seguinte

Respostas:

8

O conteúdo dos PDFs (texto e imagens) provavelmente já está compactado - portanto, não haverá muito a ganhar tentando compactá-los novamente.

afrazier
fonte
3
Bem não. Fiz um pouco de teste e peguei 24MiB de PDFs e os comprimi usando as configurações padrão. O resultado foi um arquivo 19 MiB. No meu caso, esses 5 MiB são importantes no meu caso.
precisa saber é o seguinte
11
Parece que você está certo. Não consegui produzir resultados significativamente melhores do que os padrões do 7zip, independentemente do que fiz. Ainda estou convencido de que alguma compactação é melhor que nenhuma.
AndrejaKo
3
Se você pudesse economizar muito espaço, provavelmente há trabalho que poderia ser feito com os próprios PDFs para economizar quase todo esse espaço sem o 7-Zip. Uma viagem pelo PDF Optimizer do Acrobat pode fazer maravilhas.
precisa saber é o seguinte
Veja a resposta do usuário - a compactação usada no PDF (zlib) pode ser revertida para compactá-los ainda mais (e aplicada novamente na reconstrução). Isto resulta frequentemente na redução do tamanho de ~ 50%
schnaader
@schnaader: Isso é realmente interessante. Eu já vi e usei ferramentas como o PDF Optimizer e MuPDF do Acrobat para modificar os PDFs, mantendo-os visíveis, mas ser capaz de transformá-los sem perdas assim também é muito valioso e pode ser usado com grande vantagem.
afrazier
7

Tente pré - compactação - primeiro descompacta os dados já compactados dentro dos seus PDFs. Então o 7z pode fazer sua mágica em dados não compactados.

Tente também o nanozip, que eu verifiquei ser muito eficaz, mas muito eficiente (400kb / s nas taxas de compressão dos algoritmos PAQ).

usr
fonte
2

7za a -t7z -mx-9 -mfb = 258 -mpass = 15 nome do arquivo.7z subdir

Ajuste a primeira palavra conforme necessário para o nome do seu executável da linha de comando e ajuste as partes após "-mpass = 15" para personalizar seu nome de arquivo e o que deve incluir.

Esta resposta não é específica para documentos PDF.
Isso usa LZMA, não PPM. Fiquei longe do PPM porque existem muitas variações que não são compatíveis com outras variações. O LZMA parece ser mais estável, com compatibilidade sendo mais amplamente suportada. Portanto, fiquei longe do PPM precisamente porque minha opinião era, como você afirmou, "o esforço necessário para usar algoritmos de compressão exóticos não se justifica".

TOOGAM
fonte
2
O LZMA2 é significativamente melhor que o LZMA, mas é para uso (efetivo) apenas em sistemas de 64 bits.
OMY 21/06
-3

A compactação lzma é a melhor porque você pode criar um arquivo sfx ou um pacote msi com uma alta taxa de compactação. no seu caso, você não está compactando um arquivo grande, portanto a diferença é bastante pequena, especialmente se o arquivo tiver sido compactado, como: mp3 ou png

tente ganhar arco, é gratuito e dá uma taxa de compressão gret

nader
fonte