Eu tenho um antigo conjunto de dados vetoriais com polígonos cobrindo um continente. Os dados foram publicados pela primeira vez em papel na escala 1: 5 000 000 e posteriormente digitalizados. Não tenho os dados originais e nenhuma informação sobre a vetorização ou nenhum metadado. Eu acho que a distância entre os vértices e não a precisão limita a resolução.
Os vértices são salvos com alta resolução (por exemplo, "nnn.nnnnnnnnn", "- nn.nnnnnnnnn"). O conjunto de dados possui poucos pontos que podem ser georreferenciados, e nenhum nó definido como coordenadas (por exemplo, em graus pares ou coordenadas UTM). Quando comparo algumas seções da costa, o erro é de +/- 20 km.
Eu gostaria de encontrar uma fórmula para estimar o erro máximo com base na distribuição dos vértices. Eu tenho acesso a qualquer aplicativo GIS, mas preferiria uma referência estatística robusta.
Como posso calcular o erro máximo do conjunto de dados, assumindo que todos os vértices estão corretos? Ou formulado de maneira diferente: Que método posso usar para encontrar a maior resolução do conjunto de dados?
Tentei rasterizar o conjunto de dados em diferentes tamanhos de célula e, em seguida, superamostra-lo para um tamanho de célula pequeno para detectar o menor rasterização possível sem perda de resolução, mas essa é uma abordagem bastante demorada e não muito matemática.
fonte
Respostas:
Ótima pergunta - eu já vi esse tipo de pergunta surgir várias vezes e, infelizmente, muitas pessoas que realizam análises quantitativas GIS ignoram o componente CRÍTICO do cálculo da incerteza em conjuntos de dados espaciais. Existem conceitos e terminologia importantes que precisam ser esclarecidos antes que esse tipo de tarefa possa ser resumido a resultados quantitativos.
O cálculo do erro em um conjunto de dados espacial pressupõe o conhecimento prévio da linhagem dos conjuntos de dados. Como os metadados não estão disponíveis em nenhuma etapa do processo, esse tipo de quantificação não é possível. A precisão das coordenadas em um conjunto de dados vetoriais não garante a afirmação de que o conjunto de dados é preciso em qualquer grau. Rasterizar um conjunto de dados herdará seu próprio grau de erro e incerteza nos dados.
Sem os metadados e o cálculo contínuo de erros e incertezas, o conjunto de dados pode ser considerado uma imagem bonita. Embora possa parecer um processo simples usar a escala do mapa original e a natureza precisa das coordenadas poligonais do vetor, os conceitos fundamentais da geografia serão violados se o erro e a incerteza não forem calculados em todas as etapas da criação do conjunto de dados a partir de:
Embora essa possa não ser a resposta que você está procurando, é um bom ponto de partida para qualquer pessoa em situação semelhante:
Se você tiver tarefas para calcular uma representação quantitativa precisa da incerteza de um modelo espacial, sugiro pesquisar o tópico "Incerteza e propagação de erros em dados espaciais", pois o tópico é profundo, matemático e estatisticamente denso.
Se você estiver usando o conjunto de dados como uma imagem bonita, inicie o mapeamento.
fonte
Concordo com Alex, como não há metadados disponíveis e a linhagem de dados definida como desconhecida, avaliar o erro é difícil. O erro deve ser quantificado em um local conhecido e preciso, se existir nas extensões do conjunto de dados.
fonte