Utilitário OS X gratuito para raspar sites?

11

Quero raspar todas as páginas e subpáginas de um site (por raspar, quero dizer salvar todo o conteúdo on-line em arquivos HTML locais).

Qual é o melhor utilitário para rastrear todas as páginas? Idealmente, gostaria de especificar quantas camadas profundas a serem raspadas.

Chirag Patel
fonte

Respostas:

19

Você tem duas opções:

Você pode usar o wgetutilitário de linha de comando da seguinte maneira:

wget -rl 10

Substitua o 10número pelo número de níveis que você gostaria de recuar.

Ou você pode usar o SiteSucker . Um aplicativo GUI que baixa recursivamente sites. Você também pode especificar até que ponto recorrer ao SiteSucker.

Mark Szymanski
fonte
1
SiteSucker é ótimo.
21411 neoneye
1

DeepVacuum

GUI para wget, US $ 15.

cocoawget

(livre)

Lri
fonte
Deepvacuum me faz pensar em Dire Straits: "O dinheiro para nada": D
Pitto