Ao lidar com rasters de resoluções variadas, deve-se resample para a resolução mais alta ou mais baixa?

16

Estou procurando recomendações sobre as melhores práticas para lidar com camadas de dados rasterizadas com diferentes resoluções e projeções. O conselho que recebi é sempre reamostrar para a camada com a menor resolução antes de realizar qualquer análise, mas isso parece um enorme desperdício de precisão para mim e nunca recebi uma explicação sólida sobre por que isso deve ser feito.

Quando é razoável reamostrar para corresponder a uma grade de resolução mais alta e quais são as implicações em comparação com reamostrar para uma resolução mais baixa?

Sei que isso provavelmente é altamente dependente da situação. Estou procurando principalmente diretrizes gerais, mas aqui está o meu cenário específico para referência:

Cenário: Estou procurando construir um modelo de regressão espacial que preveja o uso da terra com base em uma variedade de camadas ambientais e socioeconômicas. Meu mapa de uso da terra é derivado do Landsat e, portanto, com uma resolução de 30m. Exemplos de camadas explicativas incluem as camadas climáticas SRTM DEM (3 segundos de arco, ~ 90m) e clima climático Bioclim (30 segundos de arco, ~ 1 km).

Matt SM
fonte
1
Você poderia fornecer mais informações sobre o modelo de regressão e o método de implementação? +1 para uma pergunta interessante e bem construída!
Aaron
Estou comparando a cobertura florestal em dois momentos e usando um modelo de regressão logística com probabilidade (binária) de desmatamento como minha resposta. Vou implementá-lo em R.
Matt SM

Respostas:

17

Na verdade, não é tudo que depende da situação e é tudo sobre erro estatístico.

Sempre que você reamostrar para uma resolução mais alta, estará apresentando uma precisão falsa. Considere um conjunto de dados medidos em pés apenas em números inteiros. Qualquer ponto pode estar a +/- 0,5 pés de sua localização real. Se você reamostrar para o décimo mais próximo, agora está dizendo que qualquer número não passa de +/- 0,1 a partir da sua localização real. No entanto, você sabe que suas medidas originais não eram tão precisas e agora está operando dentro da margem de erro. No entanto, se você seguir o caminho inverso e redefinir para a resolução mais baixa, você saberá que qualquer valor de ponto determinado é definitivamente preciso porque está contido na margem de erro da amostra maior.

Fora da matemática estatística, o primeiro lugar que isso vem à mente é no levantamento de terras. Pesquisas mais antigas especificavam rolamentos até o meio minuto mais próximo e distâncias até o décimo de pé. Traçar uma travessia de fronteira com essas medições geralmente pode resultar em um erro de sigilo (o ponto inicial e o ponto final devem ser os mesmos, mas não são) medidos em pés. Pesquisas modernas chegam a pelo menos o segundo mais próximo e a centenas de centímetros. Valores derivados (como a área de um lote) podem ser significativamente afetados pela diferença de precisão. O próprio valor derivado também pode ser dado como excessivamente preciso.

No seu caso de análise, se você fizer uma nova amostra para uma resolução mais alta, seus resultados implicarão uma precisão muito maior do que os dados nos quais eles se baseiam. Considere o seu SRTM a 90m. Seja qual for o método que eles medem a elevação (retorno médio / máximo / retorno médio), a menor unidade (pixel) que pode ser diferenciada de seus vizinhos é de 90m. Se você redimensionar para 30m, ou:

  • você assume que todos os nove pixels resultantes têm a mesma elevação quando, na verdade, talvez apenas um - o centro ou o canto superior esquerdo - (ou nenhum!)
  • você interpola entre pixels, criando valores derivados não presentes antes

Portanto, em ambos os casos, você introduz uma precisão falsa porque suas novas subamostras não foram realmente medidas.

Pergunta relacionada: Quais práticas estão disponíveis para modelar a adequação da terra?

Chris W
fonte
Isso certamente vale para dados pontuais. Mas eu me pergunto se é diferente para dados raster que calcula a média de uma quantidade espacial continuamente variável, onde há precisão de localização e precisão da quantidade medida. Além disso, quantidades diferentes têm níveis diferentes de variação espacial. Por exemplo, reamostrar dados de elevação para uma resolução mais alta deve introduzir mais erros em áreas montanhosas do que nas pradarias.
Matt SM
@MattSM É verdade para todos os dados espaciais e é composto pelo erro estatístico da quantidade medida. Considere o seu SRTM a 90m. Seja qual for o método que eles medem a elevação (retorno médio / máximo / retorno médio), a menor unidade (pixel) que pode ser diferenciada de seus vizinhos é de 90m. Se você redimensionar para 30m, agora estará dizendo que todos os 9 pixels resultantes são a mesma elevação quando, na verdade, talvez apenas um (ou nenhum!) Seja - o centro ou o canto superior esquerdo. Ou você interpola entre pixels, criando valores que não estavam presentes antes e, portanto, precisão falsa. E sim, a faixa de valores é reproduzida com o erro potencial.
28714 Chris W
Apenas como uma observação lateral, é possível interpolar recursos específicos em casos especiais em que o padrão é claramente limitado - um recurso não geográfico que vem à mente é a reconstrução de informações da chapa de matrícula de fotografias com resolução muito baixa para leitura. Mas você precisa saber o que está vendo. Lembro-me de alguns casos em que a reconstrução da chapa de matrícula falhou porque a chapa em questão estava em um script não europeu, como o árabe.
Steve Barnes
E quanto aos rasters com resolução baseada em arco, eles não têm células de grade que podem ter diferentes áreas / proporções em diferentes áreas?
CMCDragonkai
@CMCDragonkai Não tenho certeza de como lidar com isso, porque você está entrando em representação de dados versus formato e coordenando sistemas / projeções. Sim, a área geográfica de uma varredura não é necessariamente tão uniforme quanto os pixels quadrados (ou de outra proporção). Muitas especificações de dados sat informam isso (o pixel é x no nadir e y na borda da faixa). Mas os problemas de reamostragem ainda se aplicam - se é que isso apenas agrava o problema. (E desculpe pelo atraso, eu não estive em SE em algum tempo.)
Chris W