Estou procurando recomendações sobre as melhores práticas para lidar com camadas de dados rasterizadas com diferentes resoluções e projeções. O conselho que recebi é sempre reamostrar para a camada com a menor resolução antes de realizar qualquer análise, mas isso parece um enorme desperdício de precisão para mim e nunca recebi uma explicação sólida sobre por que isso deve ser feito.
Quando é razoável reamostrar para corresponder a uma grade de resolução mais alta e quais são as implicações em comparação com reamostrar para uma resolução mais baixa?
Sei que isso provavelmente é altamente dependente da situação. Estou procurando principalmente diretrizes gerais, mas aqui está o meu cenário específico para referência:
Cenário: Estou procurando construir um modelo de regressão espacial que preveja o uso da terra com base em uma variedade de camadas ambientais e socioeconômicas. Meu mapa de uso da terra é derivado do Landsat e, portanto, com uma resolução de 30m. Exemplos de camadas explicativas incluem as camadas climáticas SRTM DEM (3 segundos de arco, ~ 90m) e clima climático Bioclim (30 segundos de arco, ~ 1 km).
fonte
Respostas:
Na verdade, não é tudo que depende da situação e é tudo sobre erro estatístico.
Sempre que você reamostrar para uma resolução mais alta, estará apresentando uma precisão falsa. Considere um conjunto de dados medidos em pés apenas em números inteiros. Qualquer ponto pode estar a +/- 0,5 pés de sua localização real. Se você reamostrar para o décimo mais próximo, agora está dizendo que qualquer número não passa de +/- 0,1 a partir da sua localização real. No entanto, você sabe que suas medidas originais não eram tão precisas e agora está operando dentro da margem de erro. No entanto, se você seguir o caminho inverso e redefinir para a resolução mais baixa, você saberá que qualquer valor de ponto determinado é definitivamente preciso porque está contido na margem de erro da amostra maior.
Fora da matemática estatística, o primeiro lugar que isso vem à mente é no levantamento de terras. Pesquisas mais antigas especificavam rolamentos até o meio minuto mais próximo e distâncias até o décimo de pé. Traçar uma travessia de fronteira com essas medições geralmente pode resultar em um erro de sigilo (o ponto inicial e o ponto final devem ser os mesmos, mas não são) medidos em pés. Pesquisas modernas chegam a pelo menos o segundo mais próximo e a centenas de centímetros. Valores derivados (como a área de um lote) podem ser significativamente afetados pela diferença de precisão. O próprio valor derivado também pode ser dado como excessivamente preciso.
No seu caso de análise, se você fizer uma nova amostra para uma resolução mais alta, seus resultados implicarão uma precisão muito maior do que os dados nos quais eles se baseiam. Considere o seu SRTM a 90m. Seja qual for o método que eles medem a elevação (retorno médio / máximo / retorno médio), a menor unidade (pixel) que pode ser diferenciada de seus vizinhos é de 90m. Se você redimensionar para 30m, ou:
Portanto, em ambos os casos, você introduz uma precisão falsa porque suas novas subamostras não foram realmente medidas.
Pergunta relacionada: Quais práticas estão disponíveis para modelar a adequação da terra?
fonte