HTTRACK fazendo download parcial

3

Nós estamos usando HTTRACK para baixar um site inteiro para visualização off-line.

O problema é até baixar todo o site com o nível 4 ( -r4 ) alguns links não funcionam.

Por exemplo, se você usar o httrack para capturar o site:

http://advaitasharada.sringeri.net/display/bhashya/Gita

Ele captura apenas uma parte dele, mas deixa os links do lado direito. Os outros links contendo os outros capítulos do Gita estão marcados com #fragments.

http://advaitasharada.sringeri.net/display/bhashya/Gita#BG_C02 (o link só funciona quando clicado no navegador)

  1. Por que não HTTRACK baixar todos os links? O que fazer?
  2. Também o search não está funcionando. Isso leva ao domínio original do site (que precisa de conexão com a Internet).
Br. Sayan
fonte
1
Resposta para a primeira parte: o site usa scripts do lado do servidor ou seja, o servidor gera páginas da web no vôo quando uma solicitação é feita. HTTRack só pode baixar páginas da web estáticas e, assim, perde as partes que são geradas em tempo real.
Karan Karan
1
é descarregável, apesar de grande, com 2,6 GB, você pode tentar o wget
Junme
Obrigado @ KaranKaran e @Junme! Isso é o que eu suspeitava. Envolve scripts do lado do servidor! Junme, eu tentei wget, mas não estava funcionando. Tamanho não é um problema. Eu dei -r6 e HTTRACK baixou 6,6 GB! Deus sabe como tem tantos dados! Você poderia por favor postar o wget comando que você usou como resposta? Você já verificou que os links do lado direito do site estão funcionando?
Br. Sayan

Respostas:

0

O site usa scripts do lado do servidor ou seja, o servidor gera páginas da web no vôo quando uma solicitação é feita. HTTRack só pode baixar páginas da web estáticas e, assim, perde as partes que são geradas em tempo real.

Karan Karan
fonte
Existe alguma outra maneira de baixar o site?
Br. Sayan