Eu gostaria de baixar algumas páginas da Wikipedia como parte de um programa. Atualmente, eu iria para as páginas em um navegador, clique em "Download como PDF" manualmente, aguarde a renderização, faça o download, renomeie-o e mova-o para o local desejado. Eu gostaria de automatizar isso fazendo o download deles no bash ou no Python. Isso é possível (sem usar o webdriver)?
command-line
python
download
gato do teto
fonte
fonte
1
Apenas dois links rápidos para você começar: stackoverflow.com/a/627606/935614 e mediawiki.org/wiki/API:Main_page . Ou você os deseja como PDF e não apenas o conteúdo?
Nixda
Obrigado. Eu só quero despejá-los como pdf como referência (para algo que eu possa ler mais tarde). Não preciso analisar o conteúdo.
Cat cat teto