Você conhece algum bom recurso em algoritmos de geocodificação?
Estou particularmente interessado em analisar consultas de endereços, incluindo partes correspondentes e ponderadas da consulta, lidar com erros ortográficos e variações, bem como em detalhes sobre o armazenamento físico de dados (por exemplo, esquemas para consultas diretas ao banco de dados relacional, abordagens à indexação de dados etc.) .
Estudei alguns documentos sobre geocodificação do ArcGIS 10, mas eles tocam um pouco nos detalhes reais da implementação. A documentação detalhada de outras implementações de produção de alta qualidade também pode ser útil. Quanto mais técnico, melhor. Trabalhos de algoritmo teórico também são ótimos.
Obrigado.
O artigo que o Mapperz vinculou é muito bom e possui muitas citações que provavelmente serão do seu interesse, mas não acho que eles façam um bom trabalho ao descrever a correspondência de cadeias e sua importância para o processo de geocodificação. Eles mencionaram brevemente o Soundex , mas o Soundex não é a única opção e nem a melhor opção para endereços IMO. Eles listaram algumas citações pertinentes ao tópico, para que esses trabalhos sejam do seu interesse.
Esse tópico no site de troca de estatísticas fala sobre a correspondência difusa de dois conjuntos de cadeias de caracteres, e todas as mesmas técnicas se aplicam ao combinar endereços. Particularmente, acho que o uso de distâncias de edição faz mais sentido do que o Soundex, especialmente com detalhes de endereço que não possuem analógico Soundex. Calcular a distância de Levenshtein entre duas strings não é tão complicado, e há muitos exemplos flutuando pela Internet ( aqui está um em Python).
Passei a última hora tentando descobrir como a ESRI implementa sua sensibilidade ortográfica e suas diferentes pontuações de candidatos e de correspondência. Não encontrei nada além de descrições simples (as melhores que encontrei neste PDF e na seção de ajuda on-line da 9.3 ). Portanto, se alguém puder me indicar uma documentação mais detalhada, eu ficaria agradecido, assim como o OP.
fonte
A Universidade da Carolina do Sul possui serviços de processamento de endereços e geocodificação para os quais publicaram alguns detalhes técnicos. Eles têm muitas boas referências em seu site.
fonte
A lista de discussão GEOREFERENCING fornecida pelo UK JISC https://www.jiscmail.ac.uk/cgi-bin/webadmin?A0=GEOREFERENCING
Meu blog (seção de codificação geográfica) contém uma publicação ocasional sobre codificação geográfica e resolução de topônimos (seu primo não estruturado): http://bit.ly/lQ0Sjs
fonte
Um bom recurso para geocodificação do estudo https://webgis.usc.edu/Services/Geocode/About/TechnicalDetails.aspx
fonte