Por que o Word 2010 cria arquivos PDF tão grandes?

11

Notei apenas agora que meus documentos do Word 2010 (docx) com apenas uma única página e incluem um gráfico vetorial WMF simples e um pouco de texto têm quase 1 MB de tamanho. O documento do Word tem apenas 50 kB e um arquivo PDF criado com a impressora Bullzip PDF tem aproximadamente o mesmo tamanho. Então, o que a Microsoft está escrevendo nos outros 950 kB?

Atualização: Como recebo respostas recentemente que nem todas se aplicam, eu gostaria de economizar o trabalho. O problema desapareceu depois de usar o Windows 7 em vez do XP (o que fiz há mais de um ano). Algo não parece ser suportado no sistema antigo, suspeito que seja um subconjunto de fontes ou algo assim. Também não posso tentar suas sugestões porque o problema não existe mais. Portanto, não sou capaz de aceitar respostas para isso.

ygoe
fonte
A saída corresponde? Suponho que o Word corresponda ao formato PDF mais próximo do Bullzip (nunca ouvi falar dele).
Ramhound
1
Isso só começou a acontecer após as atualizações mais recentes do WORD2010. Eu tenho o WORD2010 e o Acro Reader 9.5, mas um computador não recebeu as atualizações recentes do WORD. Aquele pega um arquivo DOCX com muita carga e converte-o PARA BAIXO de 4 MB para 3 MB, o outro computador com atualizações recentes do WORD converte o DOCX de 4 MB para 18 MB. Não consigo usar um arquivo tão grande. NÃO atualize seus programas WORD.
1
Parece que o Word está exportando imagens no formato bitmap de alta resolução. Zoom in e comparar PDFs gerados pelo Word e Bullzip e comparar a qualidade
tumchaaditya
1
Oh querida, isso é velho. O Word 2010 começou a criar arquivos PDF de tamanho mais razoável após a mudança do Windows XP para o Windows 7. Suponho que o Windows 7 tenha alguma API de subconjunto de fontes que o Word usa que o Windows XP não possui, para que sempre inclua a fonte completa ou algo assim .
ygoe
1
Acabei de ter o mesmo problema ao usar o Word 2013 no Windows 7 Pro 64 bits: tenho um arquivo do Word 2013 (docx) de 14kB SOMENTE texto de lorem ipsum com formatação padrão, o Word produz um PDF de 90kB quando o PDFcreator gera um arquivo PDF de 22kB. E cresce rapidamente, o mesmo arquivo com alguma formatação (título, títulos 1 e 2), o arquivo do Word de 15kB (sem figuras) torna-se um arquivo de 230kB com o PDF do Word salvo como (usando a compressão máxima), embora apenas 30kB com o PDFcreator. Meu problema é que o PDFcreator não processa os links.
Thomas

Respostas:

2

Isso ainda é um problema com o Word 2016. Talvez não seja o mesmo que o OP, mas ainda está lá: comece com um documento de 1 página 20 KB, salve como PDF, obtenha um PDF de 300 KB.

Não sei dizer por que o Word faz isso, mas há uma maneira fácil de minimizar esses arquivos PDF: instale o GhostScript e execute o seguinte comando:

gswin64c.exe -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/screen -dNOPAUSE -dQUIET -dBATCH "-sOutputFile=%2" "%1"

onde% 1 é o PDF de entrada e% 2 é o PDF de saída. Transforma esse PDF de 300 KB em um PDF de 40 KB. Ainda não tão pequeno quanto o CutePDF (que conseguiu cerca de 30 KB para o mesmo documento), mas uma grande melhoria.

Ou simplesmente pule esta etapa e imprima diretamente no CutePDF.

RomanSt
fonte
1
Veja o comentário de Arjan na resposta de Jakke.
fixer1234
Fazendo backup da resposta. Em vez de 670k, o cutePDF criou um arquivo de 170k.
Szako 5/05
1

Muitas razões.

  1. Estilo XML
  2. Imagens convertidas em base64, que é 33%maior que o original
  3. Outras coisas como fontes etc ...
  4. Muita coisa que aparentemente não faz nada!
Ninguém
fonte
1

Verifique as configurações das opções no Word 2010. Você pode estar instruindo o Word a incorporar uma ou várias fontes inteiras no documento. Isso causa um inchaço terrível no documento, especialmente se você estiver usando fontes Unicode. Desmarque essa opção se estiver marcada e o Word incorporará apenas os caracteres realmente usados ​​no seu documento.

Você também deve estar ciente de que * .docx é um formato de arquivo compactado que precisa ser descompactado antes de poder ser convertido em um arquivo PDF que aumenta seu tamanho.

Se isso não funcionar para você, existem várias ferramentas de otimização de PDF disponíveis no Adobe e no Nuance.

Espero que isto ajude.

Ælfstangard
fonte
0

Pensamento: o Word está convertendo o gráfico vetorial em um bitmap ou PNG e incorporando-o no documento com compactação limitada ou sem compactação. Verifique as configurações de PDF e veja se você pode ajustá-lo.

Análise: Uma maneira de verificar isso é alterar a extensão do arquivo do Word para .ZIP e ver por si mesmo o que o Word está fazendo!

Joshua
fonte
2
Você não pode ajustar a geração de PDF do Word. Você só pode escolher entre a qualidade "normal" e "web", mas isso faz apenas uma diferença de alguns kB. Vou ter que verificar a conversão de vetor para pixel, que deve ser visível em fatores de zoom muito altos.
ygoe 9/12/11
3
Estranho, quando amplio o documento em PDF, vejo textos e gráficos rasterizados por um tempo muito curto. Parece uma captura de tela da janela do Word, incluindo texto suavizado por ClearType em baixa resolução. Após esse momento, o conteúdo é substituído por desenhos vetoriais de alta resolução, para gráficos e texto. Como posso examinar o documento PDF para descobrir se há uma imagem de pixel oculta dentro que pode ser removida?
ygoe 9/12/11
Também não acredito que esse seja o motivo. Percebi o mesmo inchaço com documentos que não contêm imagens.
21912 HappyNomad
@LonelyPixel: Provavelmente leva algum tempo para o seu leitor de PDF para re-processar o conteúdo em zoom in ..
tumchaaditya
0

Isso ocorre porque a formatação do documento PDF conterá estilos para (provavelmente) cada caractere. Eu fiz algo parecido com isto, mas em HTML e ele gerou um arquivo html de 20 KB como um arquivo de 600 KB.

Damodar Dahal
fonte
0

Use software projetado para uma finalidade específica. O Word é bom na criação de documentos do Word e, como muitos outros softwares adicionam o recurso, a MS não pode deixar de lado. Eu realmente não vejo por que eles escolheriam gastar muito tempo e esforço otimizando algo que a maioria das pessoas nem usa ou se preocupa muito. As pessoas que se importam, não usam o Word para impressão em PDF.

Você deve instalar uma impressora PDF dedicada no seu computador e usar a função IMPRIMIR para criar um arquivo PDF. Existem muitos pacotes gratuitos e comerciais disponíveis que fazem um trabalho perfeito e mantêm seu arquivo PDF compactado no mínimo.

Perguntar POR QUE exatamente o Word cria arquivos PDF tão grandes é algo que você deve perguntar aos engenheiros da MS em seus fóruns ... só eles podem saber. Aqui você terá muitos palpites sobre por que a MS faz as coisas do jeito que faz.

Jakke
fonte
1
Eu prefiro muito a funcionalidade de exportação de PDF incorporada, pois isso preserva tabelas clicáveis ​​de conteúdo ou URLs incorporados e similares. (Como tal, a exportação no OpenOffice é ótima.) Alguns softwares podem funcionar bem com as opções de impressão de PDF, se fornecidas pelo sistema operacional . Como alguns navegadores no OS X, funcionam perfeitamente com a impressão em PDF incorporada .
Arjan