Estou procurando uma maneira de capturar todas as imagens de um blog, mesmo que não sejam visíveis (incorporadas) no próprio blog. Em outras palavras, imagens carregadas em uma página da web, mas ainda não incorporadas em um artigo.
Vamos que alguém tenha um blog: bestblogever.com/
E ele publicou o artigo: bestblogever.com/24/11/
Nesse artigo, existe apenas uma imagem: bestblogever.com/24/11/IMG_23.jpg
Sei que o diretório bestblogever.com/24/11/ contém mais imagens, mas não conheço os URLs. Existe uma maneira (preferencialmente) de um software que possa pesquisar e baixar todas as imagens não listadas? Por exemplo:
bestblogever.com/24/11/IMG_23.jpg
bestblogever.com/24/11/IMG_55.jpg
bestblogever.com/24/11/IMG_08.jpg
bestblogever.com/24/11/IMG_65.jpg
Eu tentei o HTTrack, mas parece apenas capturar as imagens que são realmente exibidas na página da web.
bestblogever.com/24/11/
, seria fácil. Caso contrário, você provavelmente teria que adivinhar os URLs.Respostas:
Em nosso site irmão StackOverflow, você pode ler algo semelhante a [ 1 ]
No Linux, você pode usar a mesma construção ou, por exemplo,
Notas:
%3.3d
, em vez de%d
você obteráimg000.png
...img012.png
...img100.png
, em vez deimg0.png
...img12.png
...img100.png
.| /bin/sh
), imprimirá no shell a saída gerada.Depois que você verificou sua exatidão, pode adicioná-lo novamente e executá-lo.
\n
adicionar uma nova linha para a saída. Você pode adicionarsleep 1.23 \n
depois para adicionar uma nova linha que espera 1,23 segundos entre os downloads.fonte