Como faço para extrair todos os links externos de uma página da web e salvá-los em um arquivo?
Se você tiver alguma ferramenta de linha de comando, isso seria ótimo.
linux
command-line
RogerioO
fonte
fonte
Aqui está uma melhoria na resposta de lelton: você não precisa de awk, pois o lynx tem algumas opções úteis.
se você quer números
fonte
Eu recomendaria Beautiful Soup sobre técnicas de raspagem de tela.
fonte
se a linha de comando não for uma força, você pode usar a extensão Copy All Links Firefox.
fonte