Como um (download e) converter estruturas HTML em EPUB (ou qualquer outro formato adequado para o leitor Sony PRS-505)?
Minha pergunta não é como converter um único arquivo HTML em um arquivo EPUB, pois isso é fácil; o que eu quero dizer é que tenho alguns livros que quero ler no meu Sony PRS-505 e estes livros estão mais frequentemente online em formato HTML mas com muitas páginas interligadas e existe uma página com a lista de conteúdos, como este exemplo http: / /www.edge.org/documents/ThirdCulture/d-Contents.html
... ou às vezes é um pouco mais complicado, pois a lista de conteúdo lista apenas os capítulos, e dentro dos capítulos há links para sub-capítulos, como neste exemplo: http: SLASHSLASHwww.hyw.com/Books/WargamesHandbook/ Contents.htm (só posso postar 1 hiperlink agora b / c de restrição de usuário, então é por isso que há SLASHSLASH ao invés de //)
Eu quero converter esses exemplos e vários outros, com capítulos corretos, imagens e algumas formatações aceitáveis, etc, então basicamente eu quero fazer um ebook adequado fora da árvore HTML.
Qual é o caminho mais fácil?
Respostas:
Eu uso wget para baixar recursivamente sites (normalmente online manuais html), em seguida, uma vez que eu tenho o html tudo em uma pasta eu converter para o formato de minha escolha usando o Calibre .
fonte