Eu criei um documento simples do MS Word contendo apenas esta frase:
Este é um documento pequeno.
Nada mais. Depois salvei este documento como DOCX e PDF. Aqui estão os tamanhos dos arquivos:
DOCX: 12 kB
PDF: 89 kB
Essa diferença é enorme , tecnicamente, e realmente começa a me incomodar quando a maioria dos documentos de texto com dezenas de kB no DOCX começa a gerar PDFs com centenas de kB de tamanho. O que há de tão ineficiente no formato PDF? Ou é apenas o Word usando algum algoritmo de saída terrível?
BTW, as configurações de saída do PDF foram definidas para criar o menor arquivo possível:
microsoft-word
pdf
docx
Borek Bernard
fonte
fonte
Respostas:
Se você abrir o PDF no bloco de notas ++, encontrará:
e esse objeto é referenciado aqui no final da instrução / FontFile2:
As fontes usadas pelo documento do Word são incorporadas ao PDF para que o pdf seja autocontido.
Usei esse slide-deck para decifrar as instruções em PDF.
Se você deseja impedir que as fontes sejam incorporadas no arquivo PDF, verifique se o documento do Word usa um dos 14 tipos de letra padrão disponíveis nos visualizadores de PDF (fonte Wikipedia )
fonte
Isso já aconteceu comigo muitas vezes no Microsoft Word ao tentar exportar um simples manuscrito para PDF. Um documento do Word de 5 a 8 páginas, com tamanho de ~ 50 KB, terminará em um arquivo PDF com mais de 10 MB, que é muito grande para ser enviado por e-mail a alguém.
A resposta de Rene está no caminho certo - o problema é que as fontes são incorporadas ao documento - mas apenas o uso de um dos tipos de letra padrão não resolve necessariamente o problema.
Todos os meus documentos estavam em Times New Roman, usando nada mais sofisticado que negrito e itálico. Ou assim eu pensei. Acontece que eu tenho o kerning automático ativado no meu modelo padrão (por razões óbvias ). Ao exportar para PDF, o Word estava incorporando cada uma dessas ligaduras como um objeto de fonte separado no documento, inchando-o além de qualquer crença.
A correção é simples, basta lembrar de fazê-lo sempre:
Curiosamente, você pode deixar ligaduras, alternativas contextuais e outros recursos avançados de tipografia ativados; eles não têm efeito perceptível no tamanho do PDF resultante.
Reexporte o documento como PDF e ele reduza para cerca de cem KB. Infelizmente, o kerning é insignificante, então eu não recomendaria imprimir dessa maneira, mas funciona bem para enviar um documento por e-mail.
fonte
Para fornecer uma resposta menos técnica que pode ajudar, os PDFs usam vetores (ou seja: equações matemáticas) para descrever tudo o que você vê. Todas as curvas e linhas são definidas por equações matemáticas e, portanto, haverá necessariamente muita informação para reter, principalmente quando você tiver imagens em seus documentos.
O benefício disso é que, teoricamente, você pode ampliar infinitamente, sem perder nenhuma resolução ou detalhe, porque as linhas e curvas não têm largura, para que possam ser dimensionadas com o seu zoom.
Assim como a recente alteração de fonte do Google reduziu o tamanho do logotipo de ~ 14KB para ~ 300B, fontes mais simples provavelmente ajudarão a reduzir o tamanho do arquivo.
fonte