Qualidade do geocódigo: Nominatim vs. PostGIS Geocoder vs. Geocoder :: US 2.0

14

Ocasionalmente, preciso geocodificar >> 500.000 endereços nos EUA (sem recursos ou cruzamentos). Gostaria de configurar um serviço de geocodificação localmente para lidar com esses códigos geográficos em massa.

Eu usei o Geocoder :: US 2.0 baseado em Tiger localmente no passado. O benchmarking inicial fornece uma precisão razoável em relação aos endereços geocodificados pelo Google, especialmente quando não confio no analisador Ruby e passo os elementos de endereço ao geocodificador explicitamente.

Também li bastante sobre o geocoder PostGIS . Como meus dados já estão no PostGIS, isso parece atraente, mas não os configurei localmente para testá-lo.

Além disso, alguém recomendou que eu tente o Nominatim localmente. Eu não sei muito sobre isso, exceto que não é baseado em Tiger (tanto quanto eu posso dizer), e estou pensando se vou obter resultados mais confiáveis.

Minha pergunta a qualquer pessoa com experiência com as soluções acima: Como a precisão dos três se compara? Especificamente, qual fornece os geocódigos mais consistentemente confiáveis ​​para endereços de ruas nos EUA? Não estou muito preocupado com a velocidade ou com a complexidade da configuração.

danpelota
fonte

Respostas:

14

Não tive a chance de testar os geocodificadores Nominatim e Geocoder nos EUA. No entanto, meu entendimento é que o Geocoder e o Nominatim não podem ser executados diretamente no banco de dados, o que para mim é uma grande desvantagem, pois dificulta o uso em itens como gatilhos ou atualizações em lote diretamente no banco de dados.

O geocoder PostGIS, sendo um conjunto puro de funções plpgsql do PostGIS / postgresql, roda completamente no banco de dados. Eu esperaria que os resultados do geocoder Geocoder US e PostGIS estivessem no mesmo nível e pelo que testei usando o material da Web, eles são. O Google é um pouco melhor, pois eles tiram vantagem dos nomes de lugares.

Acho que o Nominatum, pois usa dados do OSM, usa dados de tigre indiretamente, já que o OSM importa para os EUA grande parte disso vem do TIGER com correções contribuídas pelo usuário. Não sei em que época (vintage) do Tiger OSM está atualmente. Ao jogar com as interfaces da web on-line, ele também tira proveito dos nomes de lugares e tem uma reviravolta interessante, pois permite especificar o nível de zoom do geocoding, o que permite um geocoding mais rápido, definindo a precisão do zoom de que você precisa.

Divulgação completa - Eu tenho trabalhado muito no Geocoder PostGIS e escrevi o manual on-line. Vou lhe dizer um erro no qual estou trabalhando: acho que o local do ponto em que ele interpola está do lado errado da rua. Estou trabalhando para consertar isso. Se você se importa menos com o lado da rua (ou pelo menos algumas vezes), isso pode ser um problema para você.

Provavelmente vale a pena testar com as versões online comparando alguns resultados de endereços: por exemplo, nominatim, você pode testar aqui: http://open.mapquestapi.com/nominatim/v1/search.php

Para meus casos de uso, achei que a verificação difusa do nominatum não é tão boa quanto o que o PostGIS Geocoder possui. Por exemplo, meu endereço comercial (endereço postal) é 1 Devonshire Place, Boston MA. O PostGIS retorna uma resposta próxima, pelo que me lembro, o Google retorna uma resposta, mas não consigo que o Nominatim retorne uma resposta. Para ser justo, até os registros de encomendas de Boston não têm idéia de onde isso é e são listados nos registros de encomendas como Washington Street. O PostGIS pode encontrá-lo, pois realiza vários níveis de verificação e interseção de ruas transversais etc. Eu testei outros casos em que digito propositalmente o CEP errado ou algo assim e o PostGIS volta com um conjunto preciso de opções. O Google também.

LR1234567
fonte
Comentário Additonal: Provavelmente vale a pena testar com as versões on-line comparando alguns resultados endereço: por exemplo nominatim você pode testar aqui: open.mapquestapi.com/nominatim/v1/search.php
LR1234567
Obrigado pela resposta! Farei alguns testes comparativos durante a próxima semana, mais ou menos, mas fiquei impressionado com o codificador PostGIS Tiger até agora.
danpelota
Exceto o desligamento ocasional para um novato, é claro: postgis.refractions.net/pipermail/postgis-users/2011-March/...
danpelota
tigergeocoder.com usando os dados do TIGER 2013, prontos para executar sua própria instância de servidor na nuvem Amazon EC2 e geocodificar mais de 1.000.000 por dia. O PostGIS, como você mencionou, também carregou Zillow Neighbourhoods e retorna códigos FIPS para as partes do endereço. API REST semelhante ao Google, mas com seu próprio servidor, sem cota necessária.
Biba 5/05
O Nominatim corre rápido e tende a ser mais preciso em 2019, pré-novos dados de tigres. Ele não estima áreas e o palpite de endereço é apenas melhor.
Andrew Scott Evans
-1

Tecnicamente, você pode empilhar os bancos de dados Tiger e OSM em um servidor gigante e construí-los no Nominatum OSM. O Tiger pode ser importado facilmente e complementa o servidor OSM.

Quem quer que seja, a qualidade dos dados que você voltará não estará no último piso. O OSM não possui precisão para endereços nos EUA. Em algumas ocasiões, eu o vi a até 90 milhas do alvo original.

O banco de dados Tiger também não é preciso devido ao algoritmo de interpolação atribuído a ele para prever a localização dos números das ruas. Em geral, eles compensarão a meta real de 300 pés para algumas milhas.

Eu acho que você precisa avaliar o tempo e os recursos de hospedagem se estiver criando um geocoder próprio ou usando um comercial. Com o comercial, você obterá locais no último piso e não se preocupará com nada. Os preços de 500 mil custam entre US $ 600 e US $ 800 com diferentes fornecedores.

ivan
fonte
2
O que sua resposta tem a ver com sua empresa? Parece que você está incluindo uma assinatura com um link para o seu site sob o pretexto de, neste caso, um aviso desnecessário, e por isso estou editando. De qualquer forma, não inclua um link em nenhum aviso.
PolyGeo