Criar pdf do livro HTML

16

Existem alguns sites que fornecem livros como páginas HTML (por exemplo, itens legais).

O que posso usar para criar um livro em PDF a partir dessas páginas, com base na estrutura já existente?

No Windows, há o Adobe Professional (software comercial). Eu estou supondo que o Linux tem algo de graça? Uma solução envolvendo scripts seria boa para mim.

Lucian Sasu
fonte

Respostas:

9

O Caliber é uma ferramenta bastante poderosa para converter coisas em e-books em vários formatos. Disponível em um Software Center perto de você!

Não se deixe enganar por sua interface de usuário menos que bonita, pois pode fazer muito.

Oli
fonte
11
O calibre também vem com uma ferramenta de linha de comando, ebook-convert. Então, com isso você poderia fazer for file in *.html ; do ebook-convert "$file" "${file%.html}.pdf" ; donee converteria todos os arquivos html da pasta para PDF.
Frabjous
11
Essa é uma boa ferramenta, também sou um usuário do Calibre, acho que a mais recente marcou melhorias na interface do usuário.
Sabacon
4

O jeito mais fácil? Arquivo> Imprimir no seu navegador. Selecione Imprimir em arquivo como sua impressora e ele perguntará onde você deseja. Certifique-se de marcar o PDF. Clique em "Imprimir" e ele será salvo na sua unidade em vez de realmente ser impresso.

Jacob Peddicord
fonte
Obrigado. Existem muitos arquivos, no entanto. Essa manobra é praticamente impossível.
Lucian Sasu
4

Htmldoc pode ser útil, veja-o aqui; http://www.htmldoc.org/ está disponível no software center, infelizmente a versão 1.8 tem um problema com arquivos codificados em unicode, mas em muitas ocasiões ainda pode ser um salvador, o problema foi corrigido na versão de desenvolvimento 1.9.

Eu costumo usar a maravilhosa extensão de página de recados aqui; http://amb.vis.ne.jp/mozilla/scrapbook/ para o Firefox capturar as páginas da web, use as ferramentas de edição do scrapbook para corrigi-las, se necessário, e use o htmldoc para converter todas as páginas em PDF.

Sabacon
fonte
3

Você pode tentar http://www.xhtml2pdf.com/ . É um conversor para HTML / XHTML e CSS para PDF. Tudo escrito em Python.

Nichod
fonte
3

Eu recomendaria o uso do OpenOffice / LibreOffice para criar o PDF. Como teste, baixei o Wget manul (tudo em uma página) e, em seguida, abri a página HTML no OponOffice e cliquei no botão "Exportar diretamente para PDF". Ele criou o PDF com um índice do índice.

No passado, descobri que essa era a maneira mais fácil de converter páginas HTML em PDF. Também permite que você faça alterações sem muito esforço.

Imagens:

  • Manual do Wget exportado para PDF usando o Open Office Manual do Wget exportado para PDF usando o Open Office

  • Opção Exportar diretamente para PDF no Open Office Opção Exportar diretamente para PDF no Open Office

SiliconChaos
fonte
alguma idéia se o livro não estiver em uma página, mas dividido em várias seções / chaptes?
Ciprian Tomoiagă
2

Na verdade, votei na solução de calibre. Mas aqui está outro que você poderia tentar. Instale o AbiWord . Ele pode fazer conversões entre os formatos que conhece na linha de comando. Para converter todos os arquivos .html em uma pasta para .pdf, você pode:

for file in *.html ; do abiword --to=pdf "$file" ; done

Para tipografia de nível superior (mas sem dúvida mais complicado), outra opção seria PrinceXML .

frabjous
fonte
2

Dependendo do documento html a ser impresso, você pode obter os melhores resultados usando o pandoc . Este é um dos mais versáteis conversores de HTML para LaTeX. O arquivo .tex resultante pode ser facilmente convertido para PDF , usando xelatexou pdflatex. Muitas opções estão disponíveis se você estiver disposto a se aprofundar na sintaxe e nos pacotes do LaTeX. Isso pode não funcionar bem se as imagens incorporadas e os estilos HTML sofisticados forem preservados.

Loevborg
fonte
1

No google-chrome, você pode criar um arquivo pdf para um site inteiro usando uma extensão. Pessoalmente, uso a extensão Web2PDF Converter que cria um PDF com apenas um clique.

Aqui está uma captura de tela deste plug-in, fornecida pelo site da loja de extensões do Google.

insira a descrição da imagem aqui

Além disso, você pode ver um PDF criado por mim com esta ferramenta, baixando o próximo (clique direito, salvar o destino como): http://geppettvs.servehttp.com/resources/askubuntu-com.pdf (alguns navegadores como google- chrome pode permitir que você veja isso on-line).

E se você deseja editar os PDFs criados pela extensão para remover a assinatura digital colocada pela extensão na parte inferior de cada página ou para remover qualquer outra coisa, dê uma olhada no seguinte: Remover informações de texto de um PDF?

Boa sorte!

Geppettvs D'Constanzo
fonte