Existe uma maneira portátil de baixar ou armazenar em cache todas as páginas de um site para visualização offline? Eu tenho um voo de cross country amanhã e gostaria de poder armazenar em cache algumas páginas da web (particularmente a página de documentos python ( http://docs.python.org/ ) e a referência pyqt ( http: // www. riverbankcomputing.co.uk/static/Docs/PyQt4/pyqt4ref.html ).
Idealmente, eu gostaria de um complemento do Firefox ou algo assim, mas tudo funcionará bem desde que eu possa executá-lo no Linux.
Respostas:
Eu uso o HTTrack .
fonte
Eu uso o wget com essas opções para espelhar um site para uso offline
Onde
-m ativa as opções de espelhamento para espelhar um site localmente
-c continua um download anterior, caso já tenha baixado algumas páginas
-k converte href absoluto para apontar para locais para visualização offline
-E garante que os arquivos tenham extensão .html após o download.
-np baixa apenas objetos em / a / section / i / e não armazena em cache o site inteiro.
Por exemplo, eu queria baixar a documentação sul, mas não os ingressos sul, etc ...
Eu uso o Windows e executo o wget no cygwin, mas também há uma porta nativa do wget do Windows .
Embora, no seu caso, você possa fazer o download de documentos offline do python na seção de documentos do python
fonte
Experimente http://www.downthemall.net/ um plugin do Firefox. Usei-o para baixar 250 páginas de PDFs em mais de 20 arquivos separados. É extremamente poderoso. Ele tem uma sintaxe curinga / consulta que permite obter cirurgicamente apenas os arquivos que você deseja e nenhum dos irrelevantes que você não usa.
fonte
Algumas extensões do Firefox que eu conheço:
Página de recados
ScrapBook Plus
UnMHT
Pocket (não uma extensão; um recurso interno do Firefox)
Observe que:
fonte
Você pode baixar um site inteiro ou parte dele com o wget.
Verifique o manual do wget para outras opções que você pode querer passar, por exemplo, para limitar o uso da largura de banda, controlar a profundidade da recursão, configurar listas de exclusão, etc.
Outra abordagem para a navegação offline é usar um proxy de cache. Wwwoffle é um que possui muitos recursos para facilitar a retenção para navegação offline, como substituições para datas de validade especificadas pelo servidor e um recurso de pré-busca recursiva. (Eu uso o wwwoffle desde meus dias de discagem.)
fonte