Recuperando informações de coordenadas da Wikipedia?

15

Gostaria de adicionar ícones ao meu mapa, mostrando locais que possuem entradas da Wikipedia.

A API WikiLocation é um ótimo recurso para determinar as entradas do Wiki próximas a um local XY, mas possui limitações (raio de 20 km, apenas 50 pontos) que o tornam inadequado para meus propósitos.

Idealmente, eu preciso do mapa para mostrar TODOS os locais com entradas do Wiki, então acho que preciso fazer o download do arquivo de despejo da Wikipedia e analisá-lo para entradas geocodificadas.

Onde essas informações são encontradas nos arquivos de despejo da Wikipedia?

O banco de dados do Wiki pode ser baixado em http://en.wikipedia.org/wiki/Wikipedia:Database_download, mas não consigo ver quais arquivos são necessários para procurar as coordenadas.

Por exemplo, a entrada para Sydney inclui:

Coordinates:    33°51′35.9″S 151°12′40″E

Onde isso é encontrado nos arquivos de despejo? Outra maneira de expressar a pergunta é "como posso determinar quais entradas do Wiki são codificadas geograficamente?"

Stephen Lead
fonte

Respostas:

8

Consulte a seção de despejo de banco de dados em http://de.wikipedia.org/wiki/Wikipedia:WikiProjekt_Georeferenzierung/Wikipedia-World/en . Isso oferece a opção de uma conexão PostGIS.

Havia também uma opção de download de CSV ao mesmo tempo, mas que parece ter sido removida em algum momento entre 2011 e 2016.

Consulte também http://en.wikipedia.org/wiki/Wikipedia:WikiProject_Geographical_coordinates para outras opções.

Patrick
fonte
Obrigado, o download do CSV se parece com o que eu preciso, junto com o arquivo PostGIS para definir os cabeçalhos dos campos.
Stephen Lead
@StephenLead você / Patrick sabe se o arquivo CSV foi movido ou removido? Ontem, houve uma pergunta para procurá-lo e, para deixar de ser uma duplicata, estou pensando em observar aqui que o CSV não está mais disponível.
PolyGeo
@PolyGeo, não faço ideia, desculpe, eu não olhei para esse problema desde 19 de agosto de 2011;)
Stephen Lead
Nem eu! E eu mudei de carreira!
Patrick
@StephenLead Sem problemas - vou continuar editando a resposta de Patrick como planejado e espero que ele me corrija se eu entendi errado.
PolyGeo
4

Uma solução de API é provavelmente a sua melhor aposta, mas se você estiver com o objetivo de usar os despejos de banco de dados, nesta resposta do Twitter, o autor da API do WikiLocation explica um pouco que ele não está raspando todo o despejo de banco de dados da Wikipedia, mas apenas determinadas tabelas.

Começaria olhando o banco de dados de links externos e procurando os links para o GeoHack (provavelmente apenas aqueles que correspondam ao padrão usado por URLs como o de Sydney).

blah238
fonte