HTML recursivo para PDF

12

Eu tenho uma pasta com esta estrutura:

/main-folder
 /index.html
 /subfolder1
    /index1.html
    /file1.html

com muitas subpastas e apenas arquivos html ... quero converter todos eles em pdf usando apenas um comando ou um script simples que não exija todos os nomes de arquivos.

Você conhece um

Matteo Pagliazzi
fonte

Respostas:

15

Sugiro instalar a ferramenta WKHtmlToPDF em http://wkhtmltopdf.org/ (movida de: http://code.google.com/p/wkhtmltopdf/ ).

Você pode então mudar para a pasta raiz e usar find e xargs para convertê-los:

cd /main-folder
find . -name \*.html | sed 's/.html$//g' | xargs -n 1 --replace=X wkhtmltopdf X.html X.pdf

Isso criará um PDF com cada arquivo HTML.

dan_linder
fonte
Eu resolvi com uma lista de arquivos e uma festança para, mas isso é muito melhor!
Matteo Pagliazzi
5

O comando a seguir deve fazer o trabalho para um link:

gnome-web-print http://www.ubuntu.com ubuntu.pdf

Para vários links, não deve ser difícil escrever um loop que lida com cada link, um por um.

jcollado
fonte