Como o "Tamanho da palavra" afeta a compactação?

24

No 7 Zip, ao adicionar uma pasta a um arquivo, existe a opção de alterar o Tamanho do Word.

Como esse tamanho de palavra afeta a compactação, em particular o tamanho final do zip?

Notei que alterar o nível de compactação aumenta o tamanho da palavra, no entanto, mesmo no ultra, ele seleciona apenas o tamanho de 128, mesmo que a maior opção seja o dobro disso. Existe uma razão para o ultra não selecionar o maior? O tamanho ideal de compactação está entre o tamanho maior e o menor da palavra?

Aequitas
fonte
Confira o que a Shell diz neste post sobre parte de suas perguntas aqui -> The Post .
Pimp Juice IT
@LMFAO_A_JOKE que apenas diz para alguns arquivos maiores é melhor às vezes não
Aequitas
11
Isso NÃO RESPONDE a todas as suas perguntas em detalhes, mas para a ÚNICA pergunta de -> How does this word size affect compression, in particular the final size of the zip?Acho que a parte do post informando WordSize: usually the bigger, the better (and slower) for well-compressible data (such as documents). Archive size depends quite non-monotonically of it.você explica a PARTE do seu conjunto de perguntas. É por isso que eu apenas coloquei isso aqui para comentar e NÃO respondi - apenas tentando lhe dar algo !!!
Pimp Juice IT
O que faz a média última frase, tamanho Archive ... não monotonicamente dele
Aequitas
11
Acho que isso significa que o tamanho do arquivo será menor (diminuindo mais o tamanho do original) "normalmente" com o maior valor do WordSize, mas "depende" da compressibilidade dos tipos de dados que estão sendo compactados, como texto em vez de arquivos de imagem, talvez como um exemplo. A sugestão foi testar os diferentes valores para obter o valor ideal para seus dados, mas sabendo que você escolhe as melhores opções para atender às suas necessidades.
Pimp Juice IT

Respostas:

8

Realmente depende dos dados que você está compactando e do algoritmo usado.

Tamanho da palavra

Digite o comprimento das palavras, que serão usadas para encontrar seqüências idênticas de bytes para compactação. Para o LZMA, o tamanho grande das palavras geralmente oferece uma taxa de compactação um pouco melhor e um processo de compactação mais lento. O parâmetro de tamanho de palavra grande pode aumentar significativamente a taxa de compactação, caso os arquivos contenham longas sequências idênticas de bytes. Para PPMd, o tamanho da palavra tem um grande significado. Afeta fortemente a taxa de compressão e a velocidade de compressão / descompressão.

Existem algumas comparações aqui

Hefewe1zen
fonte