Quero baixar HTMLs (exemplo: http://www.brpreiss.com/books/opus6/ ) e associá- lo a um HTML ou outro formato que eu possa usar no leitor de e-books. Os sites com livros gratuitos não têm paginação padrão, não são blogs ou fóruns; portanto, não sabem como rastrear e mesclar automaticamente.
ebook
web-crawler
Hrvoje Hudo
fonte
fonte
O jeito que eu fazia isso era o Caliber.
Porém, isso se tornou muito doloroso, então eu criei uma Extensão do Chrome para facilitar.
Chama-se EpubPress ( http://epub.press ).
Ele permite que você crie um e-book a partir das guias do Chrome.
Espero que ajude!
fonte
Pandoc pode pegar um link para uma página (ou um arquivo html) e convertê-lo para pdf / epub ...
Não tenho certeza se ele rastejará. Caso contrário, você pode rastrear as páginas primeiro com o wget ou algo assim (ou apenas coletar links) e entregá-lo ao pandoc.
fonte
Você pode usar https://getpocket.com e a receita de bolso de calibre acessível através do menu "Buscar notícias".
fonte
O HTTrack é uma boa opção - ele cria um ebook a partir de um site: Ele está disponível para download aqui: https://www.httrack.com/ HTTrack "permite que você baixe um site da Internet para um local diretório, criando recursivamente todos os diretórios, obtendo HTML, imagens e outros arquivos do servidor para o seu computador. O HTTrack organiza a estrutura de links relativa do site original. "
Em seguida, você pode converter o HTML em um EPUB, AZW3 ou PDF usando o Caliber ou qualquer outro software de conversão de HTML para epub.
Uma segunda opção para converter diretamente para EPUB é o EpubPress: possui extensões para permitir o uso do Firefox (somente v44.0 +) ou Chrome. Para usar este software, você precisa abrir uma janela do navegador. Cada guia é essencialmente um 'capítulo' no seu e-book. Organize as guias na ordem de aparência desejada e ative o epubpress - ele fará o download e organizará as guias na ordem de aparência, no formato .epub. Espero que isto ajude!
* No entanto, observe que o EpubPress baixa páginas da web distintas - e não um 'site', no HTTrack. Para baixar um site com o EpubPress, você deve abrir cada link no site como uma guia separada e usar o Epubpress para coletar esses links no formato .epub.
fonte