Estou usando wget --mirror --html-extension --convert-links
para espelhar um site, mas acabo com muitos nomes de arquivos no formato post.php?id=#.html
. Quando tento visualizá-las em um navegador, ele falha, porque o navegador ignora a sequência de consultas ao carregar o arquivo. Existe alguma maneira de substituir o ?
personagem nos nomes de arquivos por outra coisa?
A resposta do --restrict-file-names=windows
funcionou corretamente. Em conjunto com os sinalizadores --convert-links
e --adjust-extension
/ -E
(anteriormente chamado --html-extension
, que também funciona, mas está obsoleto), ele produz um espelho que se comporta conforme o esperado.
wget --mirror --adjust-extension --convert-links --restrict-file-names=windows http://www.example
http://site.com/article.cgi?25
será guardado comoarticle.cgi?25.html
ver secção 2.7 na gnu.org/software/wget/manual/wget.html#HTTP-OptionsO wget não tem uma opção para modificar o nome salvo. O que você provavelmente precisará fazer é criar um script para passar e substituir? com _ ou algo semelhante. Apenas o Wget não pode fazer isso.
fonte