Existem alguns sites que fornecem livros como páginas HTML (por exemplo, itens legais).
O que posso usar para criar um livro em PDF a partir dessas páginas, com base na estrutura já existente?
No Windows, há o Adobe Professional (software comercial). Eu estou supondo que o Linux tem algo de graça? Uma solução envolvendo scripts seria boa para mim.
software-recommendation
pdf
html
Lucian Sasu
fonte
fonte
for file in *.html ; do ebook-convert "$file" "${file%.html}.pdf" ; done
e converteria todos os arquivos html da pasta para PDF.O jeito mais fácil? Arquivo> Imprimir no seu navegador. Selecione Imprimir em arquivo como sua impressora e ele perguntará onde você deseja. Certifique-se de marcar o PDF. Clique em "Imprimir" e ele será salvo na sua unidade em vez de realmente ser impresso.
fonte
Htmldoc pode ser útil, veja-o aqui; http://www.htmldoc.org/ está disponível no software center, infelizmente a versão 1.8 tem um problema com arquivos codificados em unicode, mas em muitas ocasiões ainda pode ser um salvador, o problema foi corrigido na versão de desenvolvimento 1.9.
Eu costumo usar a maravilhosa extensão de página de recados aqui; http://amb.vis.ne.jp/mozilla/scrapbook/ para o Firefox capturar as páginas da web, use as ferramentas de edição do scrapbook para corrigi-las, se necessário, e use o htmldoc para converter todas as páginas em PDF.
fonte
Você pode tentar http://www.xhtml2pdf.com/ . É um conversor para HTML / XHTML e CSS para PDF. Tudo escrito em Python.
fonte
Eu recomendaria o uso do OpenOffice / LibreOffice para criar o PDF. Como teste, baixei o Wget manul (tudo em uma página) e, em seguida, abri a página HTML no OponOffice e cliquei no botão "Exportar diretamente para PDF". Ele criou o PDF com um índice do índice.
No passado, descobri que essa era a maneira mais fácil de converter páginas HTML em PDF. Também permite que você faça alterações sem muito esforço.
Imagens:
Manual do Wget exportado para PDF usando o Open Office
Opção Exportar diretamente para PDF no Open Office
fonte
Na verdade, votei na solução de calibre. Mas aqui está outro que você poderia tentar. Instale o AbiWord . Ele pode fazer conversões entre os formatos que conhece na linha de comando. Para converter todos os arquivos .html em uma pasta para .pdf, você pode:
for file in *.html ; do abiword --to=pdf "$file" ; done
Para tipografia de nível superior (mas sem dúvida mais complicado), outra opção seria PrinceXML .
fonte
Dependendo do documento html a ser impresso, você pode obter os melhores resultados usando o pandoc . Este é um dos mais versáteis conversores de HTML para LaTeX. O arquivo .tex resultante pode ser facilmente convertido para PDF , usando
xelatex
oupdflatex
. Muitas opções estão disponíveis se você estiver disposto a se aprofundar na sintaxe e nos pacotes do LaTeX. Isso pode não funcionar bem se as imagens incorporadas e os estilos HTML sofisticados forem preservados.fonte
No google-chrome, você pode criar um arquivo pdf para um site inteiro usando uma extensão. Pessoalmente, uso a extensão Web2PDF Converter que cria um PDF com apenas um clique.
Aqui está uma captura de tela deste plug-in, fornecida pelo site da loja de extensões do Google.
Além disso, você pode ver um PDF criado por mim com esta ferramenta, baixando o próximo (clique direito, salvar o destino como): http://geppettvs.servehttp.com/resources/askubuntu-com.pdf (alguns navegadores como google- chrome pode permitir que você veja isso on-line).
E se você deseja editar os PDFs criados pela extensão para remover a assinatura digital colocada pela extensão na parte inferior de cada página ou para remover qualquer outra coisa, dê uma olhada no seguinte: Remover informações de texto de um PDF?
Boa sorte!
fonte