Como criar um mapa de erros para suportar um mapa de densidade média do kernel?

10

Criei um mapa de densidade média do kernel executando o KDEs em pontos empilhados na mesma extensão espacial. Por exemplo, digamos que temos três shapefiles representando mudas em três diferentes aberturas florestais da mesma forma e tamanho. Eu executei um KDE para cada shapefile de ponto. A saída do KDE foram então empilhados com base na extensão espacial, a fim de calcular a média na calculadora raster de Arc, por exemplo: Float(("KDE1"+"KDE2"+"KDE3")/3). Aqui está o produto final:

insira a descrição da imagem aqui

Agora, estou interessado em criar um mapa que descreva o erro associado aos KDEs médios. Espero usar o mapa de erros para representar visualmente quanto de erros está associado aos pontos de acesso (por exemplo, o ponto de acesso SW deve-se inteiramente aos pontos em uma lacuna?). Como devo criar um mapa do erro associado aos KDEs em média? Será que MSE ser a medida mais adequada de erro neste caso?

Aaron
fonte
3
É uma análise muito interessante. O que você quer dizer com "erro padrão"? Algum tipo de desvio (diferença) de cada mapa de densidade da camada "média"?
Landscape Analysis
Análise da Paisagem Post editado para endereçar comentários. Sim, eu estou pensando que uma estimativa MSE pode ser mais apropriada neste caso. Essencialmente, mostrando como cada KDE diverge do KDE médio. Não sei ao certo como juntar tudo isso usando o ArcGIS e / ou scripts.
Aaron

Respostas:

8

Uma advertência

Um erro padrão é uma maneira útil de estimar uma incerteza a partir de dados amostrados quando não há erro sistemático nos dados. Essa suposição é de validade duvidosa neste contexto, porque (a) os mapas do KDE terão localmente erros definidos que podem persistir sistematicamente entre as camadas e (b) um componente potencialmente enorme de incerteza devido à escolha do raio do kernel (ou "largura de banda ") não será refletido em nenhuma coleção desses mapas.

Algumas escolhas

Não obstante, retratar a variabilidade entre uma coleção de mapas relacionados e colocados ("empilhados") é uma ótima idéia - desde que você se lembre das limitações descritas acima. Várias medidas de variabilidade local seriam naturais nesse cenário, incluindo:

  • O intervalo de valores, expresso de forma aditiva (máximo menos mínimo) ou multiplicativamente (máximo dividido pelo mínimo).

  • A variação ou desvio padrão dos valores. A versão multiplicativa disso seria a variação ou desvio padrão dos logaritmos dos valores.

  • Um estimador robusto de dispersão, como a faixa interquartil (ou a proporção do terceiro para o primeiro quartil).

Em muitos aspectos, as medidas multiplicativas podem ser mais apropriadas para densidades, porque a diferença entre (digamos) 100 e 101 árvores por acre pode ser inconseqüente, enquanto a diferença entre 2 e 1 árvores por acre pode ser relativamente importante. Ambos exibem o mesmo intervalo (aditivo) de 101 - 100 = 2 - 1 = 1, mas seus intervalos multiplicativos de 1,01 e 2,00 diferem substancialmente. (Observe que um intervalo multiplicativo sempre excede 1, de modo que 2,00 é cem vezes mais distante de 1 que 1,01).

Computação

O cálculo dessas medidas requer alguma forma de estatística local. A funcionalidade de estatística de célula no Spatial Analyst calculará as variações, intervalos e desvios padrão. Os quantis locais podem ser encontrados com classificação . Em vez de ser exigente quanto a quais fileiras usar, escolha as convenientes próximas aos quartis. Para encontrá-los, seja n o número de grades na pilha. A mediana tem uma classificação de (n + 1) / 2 - que pode não ser um número inteiro, indicando que deve ser calculada calculando a média das classificações n / 2 e n / 2 + 1, sendo que qualquer uma delas aproximaria a mediana. Para aproximar os quartis, então, arredonde (n + 1) / 2 para baixo até o número inteiro mais próximo e, em seguida, adicione 1 e divida por 2. Seja esse número r . Usarr e n + 1 - r para as fileiras dos quartis.

Por exemplo, se a pilha tiver n = 6 grades, (n + 1) / 2 arredondado para baixo é 3 e (3 + 1) / 2 = 2 não precisará de arredondamento. Use r = 2 er = 6 + 1 - 2 = 5 para as fileiras. Com efeito, este procedimento retornaria o segundo valor mais baixo ( r = 2) e o segundo valor mais alto ( r = 5) dos seis valores em cada célula. Você pode mapear a diferença ou a proporção deles.

whuber
fonte
2
Eu imaginaria que o coeficiente de variação seria útil nesse contexto.
Jeffrey Evans
1
@jeffrey Obrigado, isso também é uma consideração. O CV é obtido dividindo a grade de desvio padrão (local) pela grade média (local). Eu não mencionei isso, mas para tais resumos multiplicativos, deve-se tomar algum cuidado para mascarar áreas onde o denominador (a média ou o mínimo, conforme o caso) é próximo de zero: os resultados podem não ser confiáveis ​​e provavelmente refletirá nada além de imprecisão numérica e pequenas imprecisões na aproximação dos kernels.
whuber
@whuber, você poderia falar sobre (a) em seu primeiro parágrafo? Por exemplo, você está se referindo a erros nas técnicas de coleta de dados que podem persistir em cada falha na floresta (e, portanto, se manifestar sistematicamente em cada varredura do KDE) ou a erros associados à implementação da função focal?
MannyG
@whuber Grandes ideias por toda parte - muito obrigado!
Aaron