Escreva um utilitário de compactação para arquivos gzip

11

A tarefa desse desafio é a seguinte:

Escreva um programa que leia um arquivo de tamanho razoável (digamos <16 MB) do stdin ou de qualquer outro lugar (como quiser, mas não deve ser codificado) e coloque a saída compactada no stdout. A saída deve ser um arquivo compactado gzip válido e, se o arquivo compactado for executado através do gunzip, deverá render exatamente o mesmo arquivo de antes.

Regras

  • A linguagem de programação usada deve ser conhecida antes do início desta competição
  • A pontuação do seu programa é o número de caracteres do código fonte ou do programa montado (o que for menor)
  • Você não tem permissão para usar qualquer tipo de bibliotecas de compactação existentes.
  • Diverta-se!
FUZxxl
fonte
2
É permitido o uso de bibliotecas internas?
hallvabo
@hallvabo: Não. Esqueci isso. Thx
FUZxxl
2
Provavelmente, a melhor maneira de fazer isso é preencher a entrada com os marcadores "o bloco a seguir está descompactado" no início de cada bloco.
Anon.
O gzip é uma linguagem de programação. Não é um Turing completo embora.
Alexandru
1
Isso é praticamente idêntico ao problema das armas e zips . Por que alguém postaria suas respostas aqui em vez de no codegolf.com está além de mim, a menos que queira resolvê-lo em um idioma não suportado pelo codegolf.com (por exemplo, GolfScript).
Chris Jester-Young

Respostas:

10

C # (534 caracteres)

using System.IO;using B=System.Byte;class X{static void Main(string[]a){var f=File.ReadAllBytes(a[0]);int l=f.Length,i=0,j;var p=new uint[256];for(uint k=0,r=0;k<256;r=++k){for(j=0;j<8;j++)r=r>>1^(r&1)*0xedb88320;p[k]=r;}uint c=~(uint)0,n=c;using(var o=File.Open(a[0]+".gz",FileMode.Create)){o.Write(new B[]{31,139,8,0,0,0,0,0,4,11},0,10);for(;i<l;i++){o.Write(new B[]{(B)(i<l-1?0:1),1,0,254,255,f[i]},0,6);c=p[(c^f[i])&0xFF]^c>>8;}c^=n;o.Write(new[]{(B)c,(B)(c>>8),(B)(c>>16),(B)(c>>24),(B)l,(B)(l>>8),(B)(l>>16),(B)(l>>24)},0,8);}}}

Muito mais legível:

using System.IO;
using B = System.Byte;
class X
{
    static void Main(string[] a)
    {
        // Read file contents
        var f = File.ReadAllBytes(a[0]);
        int l = f.Length, i = 0, j;

        // Initialise table for CRC hashsum
        var p = new uint[256];
        for (uint k = 0, r = 0; k < 256; r = ++k)
        {
            for (j = 0; j < 8; j++)
                r = r >> 1 ^ (r & 1) * 0xedb88320;
            p[k] = r;
        }

        uint c = ~(uint) 0, n = c;

        // Write the output file
        using (var o = File.Open(a[0] + ".gz", FileMode.Create))
        {
            // gzip header
            o.Write(new B[] { 31, 139, 8, 0, 0, 0, 0, 0, 4, 11 }, 0, 10);
            for (; i < l; i++)
            {
                // deflate block header plus one byte of payload
                o.Write(new B[] { (B) (i < l - 1 ? 0 : 1), 1, 0, 254, 255, f[i] }, 0, 6);
                // Compute CRC checksum
                c = p[(c ^ f[i]) & 0xFF] ^ c >> 8;
            }
            c ^= n;
            o.Write(new[] {
                // CRC checksum
                (B) c, (B) (c >> 8), (B) (c >> 16), (B) (c >> 24),
                // original file size
                (B) l, (B) (l >> 8), (B) (l >> 16), (B) (l >> 24)
            }, 0, 8);
        }
    }
}

Comentários:

  • Espera o caminho para o arquivo como o primeiro argumento da linha de comando.

  • O arquivo de saída é o arquivo de entrada + .gz.

  • Eu não estou usando nenhuma biblioteca para fazer o gzip, deflate ou CRC32. Está tudo lá.

  • Este "compressor" aumenta o tamanho do arquivo em um fator de 6. Mas está no formato gzip válido!

  • Testado usando o GNU gunzip e o WinRAR.

Timwi
fonte