Estou tentando fazer uma comparação objetiva de dois mapas diferentes para a mesma região. No momento, estou lutando com a definição de critérios que me permitam fazer uma avaliação desapaixonada.
Alguém tem alguma idéia de como fazer isso ou como devo abordar o problema?
Como você pode ver, nenhum mapa é superior, algumas lacunas no conjunto azul, outras no vermelho.
cartography
data-quality
Styp
fonte
fonte
Respostas:
Esta resposta descreve um método objetivo para medir discrepâncias arbitrárias entre dois conjuntos de dados espaciais. Essas discrepâncias podem incluir mudanças de posição, mudanças de forma e recursos presentes em um conjunto de dados, mas não em outro. Essa resposta não fornece meios para determinar qual é "melhor", porque isso depende de muito mais do que apenas os dados e depende particularmente de para que os dados serão usados.
fundo
Uma boa base para um grande conjunto de tais medidas depende da transformação da distância euclidiana de cada conjunto de dados. Isso visualiza cada conjunto de dados como representando uma coleção de pontos no plano. Vamos chamar essas coleções de B para os recursos azuis e R para os recursos vermelhos.
Para qualquer ponto x no plano, a distância Euclidiana transformar de um conjunto de pontos A calcula a maior limite inferior das distâncias entre x e A . Podemos pensar esta transformação como a criação de uma "superfície", cuja altura x é igual a menor distância x para A . Assim, esta superfície tem vales em todos os pontos de um , em que a sua altura é igual a zero, e sobe na proporção de 1: 1 declive longe de um . É claro que a transformação de distância, por sua vez, determina A (ou tecnicamente seu fechamento métrico , que para os conjuntos de dados GIS é o mesmo que A) como o conjunto de todos os pontos a uma altura de zero. Assim, a transformação de distância captura completamente todas as informações espaciais de A que o GIS é capaz de representar.
Esta figura mostra as transformações de distância de B (à esquerda) e R (à direita) em pseudo-relevo.
Comparando dois conjuntos de dados
Para comparar B e R , sobreponha cada um à transformação de distância da outra:
Os valores da distância são mostrados como cores graduadas de azuis (próximo de 0) a vermelhos.
O mapa da esquerda, por exemplo, mostra os pontos de B e cores-los de acordo com suas distâncias R . Os papéis de B e R são trocados no mapa certo.
Isso já ajuda a fazer comparações: cada mapa mostra os pontos de um conjunto de dados e, pelo uso de cores, enfatiza os pontos que estão longe de qualquer ponto no outro conjunto de dados. Observe que os dois mapas são necessários para a comparação, porque cada um mostra pontos que não estão no outro.
Em mapas detalhados, a cor pode ser difícil de ver; portanto, podemos optar por desfocá-la um pouco para apresentação ou avaliação visual:
Nota: as cores não são comparáveis entre os dois mapas: dentro de cada mapa, elas são dimensionadas para mostrar toda a gama de distâncias nesse mapa.
Análise estatística das diferenças
A beleza dessa abordagem está no que pode ser feito no pós-processamento. Usando uma varredura para representar a distância transformada e suas sobreposições, podemos obter facilmente estatísticas - locais e globais - para medir as discrepâncias. Por exemplo, podemos nos concentrar em todas as distâncias maiores do que um pequeno limiar para explorar sua distribuição de frequência:
Neste histograma, barras azuis são para os recursos azuis, barras vermelhas para os recursos vermelhos. (Observe a escala logarítmica no eixo horizontal.) Este histograma mostra os dados sobrepostos originais, não os dados desfocados derivados. Ele selecionou apenas as distâncias maiores que três pixels na imagem original.
Esses histogramas mostram que é muito mais provável que os traços azuis fiquem longe dos traços vermelhos do que vice-versa : as barras azuis são mais altas que as vermelhas e se estendem a distâncias maiores (à direita). Todo o arsenal de estatísticas descritivas está agora disponível para quantificar as diferenças entre os dois conjuntos de dados. Essas estatísticas podem ser aplicadas a toda a região de interesse ou "em janela" sobre ela para explorar como os dois conjuntos de dados diferem de acordo com o local.
Implementação
A maioria dos GIS raster fornece uma transformação de distância euclidiana (como EuclideanDistance no ArcGIS e r.grow.distance no GRASS), e todas suportam a sobreposição simples (mascaramento) necessária para fazer essa análise. O desfoque, se desejado, pode ser feito com uma média de vizinhança ou convolução do kernel (que inclui o "desfoque gaussiano" disponível em todos os softwares de processamento de imagem). A maioria dos GISes que não fornecem suporte adequado para análise estatística completa de dados raster, embora, mas eles são bons em exportar esses dados em formatos legíveis por software estatístico e matemático, como
R
ou Mathematica (que fez todas as figuras aqui).fonte
Como é um problema de validação de geometria, carregue as imagens atuais e veja se você pode validar as ruas como existentes ou como presentes. Provavelmente, um conjunto de dados é mais recente e / ou mais completo. Descubra qual conjunto de dados tem a maior precisão horizontal e quais foram coletados mais recentemente e por qual processo. É uma diferença entre os traços de tigre, osm, gis e gps? As imagens são suas amigas aqui, pelo menos imagens precisas como a HAIP da safra recente. O critério pode ser, integridade, cobertura, precisão, exatidão, moeda.
fonte
Eu acho que seguindo os comentários e respostas acima (talvez esse também deva ser um comentário, e não uma resposta), mas eu usaria o mapeamento que tenho disponível para validar os arquivos por comparação visual. Escolha os recursos onde há dados plotados precisos disponíveis, como as redes rodoviárias (na Inglaterra, Escócia e País de Gales estão disponíveis gratuitamente no SO).
Seguindo a sugestão de usar o Google Earth e as imagens. Use o plugin openlayers para carregar imagens de satélite em segundo plano e comparar novamente.
Muitos mapas precisos gratuitos estão disponíveis para serem usados como base de comparação.
fonte