Por que gzipar um arquivo no stdin produz uma saída menor que o mesmo arquivo fornecido como argumento?

13

Quando eu faço:

# gzip -c foo > foo1.gz 
# gzip < foo > foo2.gz

Por que foo2.gzacaba sendo menor em tamanho do que foo1.gz?

MichalH
fonte

Respostas:

19

Porque está salvando o nome do arquivo e o carimbo de data e hora para que ele possa tentar restaurar os dois depois de descompactá-lo posteriormente. Como fooé fornecido gzipvia <stdin>no seu segundo exemplo, ele não pode armazenar as informações do nome do arquivo e do registro de data e hora.

Na página de manual:

   -n --no-name
          When compressing, do not save the original file name and time stamp by default. (The original name is always saved if the name had
          to  be truncated.) When decompressing, do not restore the original file name if present (remove only the gzip suffix from the com-
          pressed file name) and do not restore the original time stamp if present (copy it from the compressed file). This  option  is  the
          default when decompressing.

   -N --name
          When compressing, always save the original file name and time stamp; this is the default. When decompressing, restore the original
          file name and time stamp if present. This option is useful on systems which have a limit on file name  length  or  when  the  time
          stamp has been lost after a file transfer.

Recriei o problema aqui:

[root@xxx601 ~]# cat /etc/fstab > file.txt
[root@xxx601 ~]# gzip < file.txt > file.txt.gz
[root@xxx601 ~]# gzip -c file.txt > file2.txt.gz
[root@xxx601 ~]# ll -h file*
-rw-r--r--. 1 root root  465 May 17 19:35 file2.txt.gz
-rw-r--r--. 1 root root 1.2K May 17 19:34 file.txt
-rw-r--r--. 1 root root  456 May 17 19:34 file.txt.gz

No meu exemplo, file.txt.gzé o equivalente ao seu foo2.gz. O uso da -nopção desativa esse comportamento quando, caso contrário , teria acesso às informações:

[root@xxx601 ~]# gzip -nc file.txt > file3.txt.gz
[root@xxx601 ~]# ll -h file*
-rw-r--r--. 1 root root  465 May 17 19:35 file2.txt.gz
-rw-r--r--. 1 root root  456 May 17 19:43 file3.txt.gz
-rw-r--r--. 1 root root 1.2K May 17 19:34 file.txt
-rw-r--r--. 1 root root  456 May 17 19:34 file.txt.gz

Como você pode ver acima, os tamanhos file.txte file3.txtos tamanhos dos arquivos são correspondentes, pois agora eles estão omitindo nome e data.

Bratchley
fonte