Estou tentando fazer o download de um URL semelhante http://www.somesite.com/restaurants.html#photo=22x00085
.
Coloquei-o entre aspas simples, mas ele só baixa http://www.somesite.com/restaurants.html, que não é a página correta.
Há uma solução?
Estou tentando fazer o download de um URL semelhante http://www.somesite.com/restaurants.html#photo=22x00085
.
Coloquei-o entre aspas simples, mas ele só baixa http://www.somesite.com/restaurants.html, que não é a página correta.
Há uma solução?
Respostas:
wget
está funcionando bem. A sintaxe do URI especifica que o fragmento - a#foo
parte - deve ser interpretado inteiramente do lado do cliente e não usado ao recuperar o próprio documento.Por exemplo, se for uma página HTML, o navegador pode rolar para uma seção nomeada ou, no seu caso, acionar algum código JavaScript que mostra uma foto específica.
Em outras palavras, no que diz
wget
respeito, os URIshttp://www.somesite.com/restaurants.html#photo=22x00085
ehttp://www.somesite.com/restaurants.html
... aponte para a mesma página
/restaurants.html
. Cabe ao seu navegador fazer o resto. A aberturarestaurants.html#photo=22x00085
no navegador deve funcionar bem.fonte
Sem visitar o link adequado, não sei dizer qual é, mas existem apenas duas opções:
O hash, na verdade, faz parte do nome do documento solicitado. Nesse caso, você pode codificá-lo:
No outro caso, em circunstâncias normais, http://www.somesite.com/restaurants.html e http://www.somesite.com/restaurants.html#photo=22x00085 devem apontar para a mesma página. A parte após o hash simplesmente indica a âncora para a qual o navegador deve rolar após o carregamento da página; ele nem é enviado para o servidor.
No entanto, é possível que o hash seja (ab) usado para carregar uma foto específica com JavaScript. O Wget não pode interpretar JavaScript, então não há nada que você possa fazer sobre isso.
fonte
Esse não é o URL da imagem. É o URL de uma página que usa um script ou outro código para buscar a imagem. Tente carregar a página com o JavaScript desativado. É isso que o wget está buscando para você.
Para encontrar o URL da imagem, tente visitar a página pelo navegador e clique com o botão direito do mouse na foto. Deve haver uma opção para visualizar informações sobre a imagem, incluindo seu URL.
Se isso não funcionar, pode ser porque a imagem está sendo carregada através do Flash ou de algum outro programa do lado do cliente. Você pode usar o Fiddler ou o Wireshark para ver qual URL está sendo carregado.
Se você nos fornecer o URL real do site com a imagem, podemos ajudá-lo a determinar como a imagem está sendo carregada.
fonte