Converta páginas da web em um arquivo para ebook

23

Quero baixar HTMLs (exemplo: http://www.brpreiss.com/books/opus6/ ) e associá- lo a um HTML ou outro formato que eu possa usar no leitor de e-books. Os sites com livros gratuitos não têm paginação padrão, não são blogs ou fóruns; portanto, não sabem como rastrear e mesclar automaticamente.

Hrvoje Hudo
fonte

Respostas:

13

Você pode usar o Calibre para atender às suas necessidades de conversão de e-books. Você pode fazer um único livro eletrônico de vários arquivos HTML, vinculando-os a partir de um único arquivo HTML que você configurar como um índice como este .

Mr Alpha
fonte
Estou usando o Sigil para a conversão para EPUB, mas não sabia que o Cailbre pode criar um ebook com vários htmls vinculados. Vou tentar, obrigado!
Hrvoje Hudo
1
Você pode usar o httrack.com para baixar as páginas da Web e, em seguida, usar o Calibre para convertê-las em um formato ePub.
에이 바
3
Meu processo é (usando o Chrome) usar o bookmarklet Instapaper Text para limpar um pouco as coisas e clicar com o botão direito do mouse -> Salvar como, optar por salvar como uma única página da web, apenas HTML, e abrir no Caliber, converter em EPub, em seguida, use a funcionalidade Editar livro para arrumar quaisquer pedaços adicionais de marcação desarrumados que são puxados.
El Yobo
6

O jeito que eu fazia isso era o Caliber.

Porém, isso se tornou muito doloroso, então eu criei uma Extensão do Chrome para facilitar.

Chama-se EpubPress ( http://epub.press ).

Ele permite que você crie um e-book a partir das guias do Chrome.

Espero que ajude!

HaroldT
fonte
3
O site no seu link sugere que a embalagem ocorre em um servidor de terceiros e a privacidade NÃO é garantida com esse método.
Burgi
Você tem sugestões de alterações que o deixariam mais seguro? Esforcei-me ao máximo para exigir apenas as informações mínimas necessárias para criar um livro, mas estou aberto a mais comentários. Se você procurar qualquer serviço comparável, verá que qualquer conteúdo que você deseja salvar é enviado para um servidor. A diferença é que esses serviços também exigem uma conta e têm todo o conteúdo associado ao seu nome. Eles também não fornecem código-fonte para seus sites para permitir que você veja o que eles coletam. A extensão é de código aberto e fico feliz em responder a quaisquer perguntas sobre esse código.
HaroldT
Que ótima ferramenta! Muito obrigado por fornecer à comunidade gratuitamente!
vonjd
5

Pandoc pode pegar um link para uma página (ou um arquivo html) e convertê-lo para pdf / epub ...

Não tenho certeza se ele rastejará. Caso contrário, você pode rastrear as páginas primeiro com o wget ou algo assim (ou apenas coletar links) e entregá-lo ao pandoc.

ananth.p
fonte
de acordo com a página do manual: "Em vez de um arquivo, um URI absoluto pode ser fornecido. Nesse caso, o pandoc buscará o conteúdo usando HTTP"
jopasserat
1

Você pode usar https://getpocket.com e a receita de bolso de calibre acessível através do menu "Buscar notícias".

insira a descrição da imagem aqui

gagarine
fonte
1

O HTTrack é uma boa opção - ele cria um ebook a partir de um site: Ele está disponível para download aqui: https://www.httrack.com/ HTTrack "permite que você baixe um site da Internet para um local diretório, criando recursivamente todos os diretórios, obtendo HTML, imagens e outros arquivos do servidor para o seu computador. O HTTrack organiza a estrutura de links relativa do site original. "

Em seguida, você pode converter o HTML em um EPUB, AZW3 ou PDF usando o Caliber ou qualquer outro software de conversão de HTML para epub.

Uma segunda opção para converter diretamente para EPUB é o EpubPress: possui extensões para permitir o uso do Firefox (somente v44.0 +) ou Chrome. Para usar este software, você precisa abrir uma janela do navegador. Cada guia é essencialmente um 'capítulo' no seu e-book. Organize as guias na ordem de aparência desejada e ative o epubpress - ele fará o download e organizará as guias na ordem de aparência, no formato .epub. Espero que isto ajude!

* No entanto, observe que o EpubPress baixa páginas da web distintas - e não um 'site', no HTTrack. Para baixar um site com o EpubPress, você deve abrir cada link no site como uma guia separada e usar o Epubpress para coletar esses links no formato .epub.

str8arrow
fonte