Eu estou tentando obter uma réplica exata de uma página. Eu uso:
wget -E -H -k -K -p http://example.com
Tudo funciona bem, exceto:
- Se no meu estilo houver uma importação de outro arquivo CSS, ele não será baixado.
- Se o JavaScript colocar as imagens em qualquer lugar, elas não serão baixadas (coloque uma classe em uma tag de âncora e, em seguida, no meu arquivo script.js, coloque a imagem no jQuery.
Alguma idéia de como conseguir um desses para trabalhar?
Respostas:
Eu uso pavuk para espelhamento e funciona muito bem - o espelho resultante é visível no navegador e também analisa parcialmente o javascript (mas é claro que não completamente):
Você também pode usar o -skip_url_rpattern para evitar que alguns scripts dinâmicos inúteis sejam espelhados, por exemplo:
fonte