Ao usar wget
um script para baixar alguns arquivos do Google Docs, o nome do arquivo não é preservado. Por exemplo:
wget 'http://spreadsheets.google.com/pub?key=pyj6tScZqmEfbZyl0qjbiRQ&output=xls'
salva o arquivo como em pub?key=pyj6tScZqmEfbZyl0qjbiRQ
vez de indicatorhivestimatedprevalence15-49.xls
, que é o que recebo se clicar no link em um navegador. Existe alguma maneira de impor esse comportamento "semelhante ao navegador" wget
?
Você pode tentar usar o curl para baixar e manter o nome do arquivo original:
consulte opções de linha de comando curl .
fonte
O link do Google Docs está realmente dizendo para executar um script no servidor, analisando-o no arquivo que você deseja. O arquivo, que eu saiba, nunca existe no servidor no formato els, mas é gerado no tempo de execução quando você solicita. Portanto, não há nada para o wget obter.
Para fazer o download do arquivo, você precisa usar a http://code.google.com/apis/documents/docs/3.0/developers_guide_protocol.html#DownloadingDocs/ API do Google .
fonte
.xls
arquivo em tempo real. No entanto, um navegador completo não tem problemas com isso. Portanto, é obviamente possível ficar sem a API do Documentos.