Enigma geoespacial ecológico

15

Estou procurando uma solução diferente e mais elegante para um problema de estatística espacial. Os dados brutos consistem em uma coordenada xy para cada árvore individual (ou seja, convertida em um arquivo .shp de ponto). Embora não seja usada neste exemplo, toda árvore também possui um polígono correspondente (ou seja, como .shp) que representa o diâmetro da coroa. As duas imagens à esquerda mostram estimativas de densidade de kernel em escala de paisagem (KDEs) derivadas de um arquivo .shp pontual de locais de árvores individuais - uma de 1989 e outra de 2009. O gráfico à direita mostra a diferença entre os dois KDEs onde apenas valores +/- 2 desvios padrão da média são exibidos. A calculadora raster da Arc foi usada para realizar o cálculo simples (KDE 2009 - KDE 1989) necessário para produzir a sobreposição raster na imagem à direita.

Existe um método mais apropriado para analisar a densidade da árvore ou a alteração da área do dossel ao longo do tempo, estatística ou gráfica? Dados esses dados, como você avaliaria a mudança entre os dados das árvores de 1989 e 2009 em um ambiente geoespacial? Soluções em ArcGIS, Python, R, Erdas e ENVI são incentivadas.

insira a descrição da imagem aqui

Aaron
fonte
3
Você tem os dados originais de localização da árvore de 1989? Caso contrário, os KDEs usam pelo menos os mesmos kernels (e as mesmas larguras de banda)? Os dados da árvore são um censo completo da área ou são algum tipo de amostra (e se sim, como os membros dessa amostra foram selecionados)? O que constitui uma "mudança" em seu estudo e como você gostaria de medi-la (por exemplo, como uma mudança absoluta na densidade das árvores ou uma mudança relativa)?
whuber
1
@ whuber: Os locais originais das árvores podem ser considerados dados do censo, pois todas as árvores do DOQQ foram inventariadas. O KDE foi baseado em pontos derivados dos dados do censo. Estou interessado principalmente em detectar novas árvores e alterar a cobertura do dossel.
Aaron
1
Os KDEs podem ser inapropriados aqui, pois a mudança na localização e nos números da árvore mudará a largura de banda e, portanto, os resultados. Você já pensou em criar uma varredura zonal de tamanho arbitrário (digamos 100m x 100m) e obter árvores / célula e área / célula de árvore para cada vez e depois calcular a diferença entre os tempos?
blindjesse
@ BlindJesse: Você tem um bom argumento. Como alternativa, estou brincando com a idéia de converter os polígonos do diâmetro do dossel de 2009 e 1989 em rasters, depois reclassificar os rasters em dados binários. A partir daí, eu posso executar um script de estatísticas focais da janela em movimento sobre a diferença entre os dois.
Aaron
1
Ainda não tenho certeza da forma dos dados brutos, Aaron. Quando você escreve "todas as árvores ... foram inventariadas", isso significa que cada árvore individual foi identificada e recebeu coordenadas? Ou talvez signifique que alguém desenhou um polígono e disse: "Encontrei 39 bordos vermelhos e 13 carvalhos brancos aqui dentro?" Compreender os pontos fortes e as limitações dos dados originais é crucial para obter a resposta canônica que você procura.
whuber

Respostas:

8

Primeiro problema:

Você está olhando uma mistura de mínimos. Uma árvore gigantesca com uma coroa do tamanho de um hectare parece bastante , interpretada com base na densidade de pontos / grãos, como um campo sem árvores. Você terá altos valores apenas onde houver árvores pequenas e de rápido crescimento, nas bordas e nas brechas da floresta. A parte complicada é que essas árvores menores e densas têm muito mais chances de serem obscurecidas por sombras ou oclusões ou serem resolvidas a uma resolução de 1 metro, ou aglomeradas juntas porque são um grupo da mesma espécie.

A resposta de Jen está correta nesta primeira parte: jogar fora as informações do polígono é um desperdício. Há uma complicação aqui, no entanto. As árvores de cultivo aberto têm uma copa muito menos vertical e mais espalhada, todas as outras coisas iguais, do que um estande de idade par ou uma árvore em uma floresta madura. Para mais, consulte o item 3.

Segundo problema:

Idealmente, você deve trabalhar com uma comparação de maçãs com maçãs. Confiar no NDVI para um e P&B para outro introduz um viés desconhecido nos seus resultados. Se você não conseguir obter dados adequados para 1989, poderá usar dados degradados em preto e branco para 2009, ou mesmo tentar medir o viés nos dados de 2009 em relação ao preto e branco e extrapolar os resultados do NDVI para 1989.

Pode ou não ser plausível abordar esse ponto do ponto de vista trabalhista, mas há uma chance decente de que isso seja apresentado em uma revisão por pares.

Terceiro problema:

O que exatamente você está tentando medir? A densidade do kernel não é um valor sem valormétrica, fornece uma maneira de encontrar áreas de árvores jovens que crescem rapidamente e que se matam rapidamente (sujeitas às limitações de sombreamento / oclusão acima); Somente aqueles com o melhor acesso à água / luz do sol, se houver, sobreviverão em alguns anos. A cobertura do dossel seria uma melhoria na densidade do kernel para a maioria das tarefas, mas isso também tem problemas: trata um grande conjunto de árvores de 20 anos de idade pareada que mal fecharam o dossel da mesma forma que uma planta estabelecida. floresta de anos. As florestas são difíceis de quantificar de maneira a preservar as informações; Um modelo de altura da copa é ideal para muitas tarefas, mas é impossível obter historicamente. A métrica que você usa é melhor escolhida com base na elaboração de seus objetivos. O que eles são?

Editar:

O objetivo é detectar a expansão do mato nas pastagens nativas. Os métodos estatísticos ainda são perfeitamente válidos aqui, eles exigem apenas algumas elaborações e escolhas subjetivas para serem aplicadas.

  • Calcule uma medida básica da cobertura do dossel. Isso pode envolver uma abordagem em grade diretamente nos polígonos da coroa ou transformar os polígonos da coroa em um raster + desfocando-os se você precisar de uma versão mais contínua.
  • Tente separar classes de paisagem nas quais você deve fazer sua análise, com base na porcentagem de cobertura do dossel. As técnicas estatísticas com as quais você trabalha na floresta fechada de dossel podem ser diferentes daquelas usadas em uma pastagem quase nua, ou podem até ser excluídas defensivamente da análise. Alguma pequena área de suas paisagens incluirá "expansão de matagal" e escolher como subdividir esse efeito e ignorar dados que não são relevantes depende de você como estatístico.
  • Não sei se isso funcionará durante um período de tempo de 20 anos (e funcionará melhor com épocas intermediárias adicionais), mas tente prestar atenção ao diâmetro da coroa como um proxy para a idade das árvores. Há uma pergunta definitiva que você deve fazer, se o dobro do tamanho de uma coroa existente representa "expansão" ou se requer novas árvores. Se for o último, você tem alguma idéia de se eles são novos (pelo menos para algumas classes de paisagem que você selecionou acima, onde é possível verificar um certo grau de acesso à luz solar).
  • Dependendo dos seus objetivos ecológicos, pode valer a pena não apenas explorar a densidade das árvores diretamente, mas explorar a fragmentação da paisagem usando pacotes como o Fragstats .
  • Plano geral: verifique se não há um conjunto de dados LIDAR do condado aguardando para ser usado como validação e avaliação de precisão para sua capacidade de distinguir coroas no conjunto de dados de 2009.
MappingAmanhã
fonte
Obrigado Chris, Você trouxe muitos buracos legítimos na abordagem do KDE para a detecção de alterações. Tenho lutado com a melhor forma de lidar com a diferença na qualidade da imagem entre 2009 e 1989. Concordo que um conjunto de dados de treinamento é necessário para comparar a saída de imagens. O objetivo desses dados é avaliar a expansão de mato em pastagens nativas. Entendo que a melhor abordagem é utilizar o poder desses dados do censo e, de fato, não usar uma abordagem estatística - mas sim uma descrição.
Aaron
Não necessariamente. Resposta editada com algumas sugestões.
MappingTomorrow
5

O problema com a sua abordagem do KDE é que ela suaviza toda a área e fecha as lacunas que você pode querer encontrar.

Quando li que você usou o NDVI para a detecção de copas de árvores, me pergunto como são os polígonos de copas. esses polígonos realmente únicos com identificação de espécies de árvores estão ligados a ele?

Se você tem o luxo de ter polígonos para cada copa de uma árvore e está interessado em perder uma copa, acho que há duas possibilidades; um vetor e uma solução raster.

vetor

  1. combine todos os polígonos de um ano para que não permaneçam sobrepostos. polis simples são bons. isso levará a dois shapefiles
  2. use sobreposição ou interseção para encontrar áreas onde 1989 e 2009 não coincidem (mais).

raster

  1. converta todos os polígonos de cada ano em uma varredura binária com 0 = notree e 1 = tree. usar alta resolução, por exemplo, 0,5m e interpol bilinear? isso garantirá que as bordas sejam suaves
  2. subtraia as imagens binárias (2009-1989) e você deverá obter algo semelhante ao seu primeiro resultado, mas livre dos KDEs suavizados

Espero que dê certo :) Não tentei essas idéias, mas simplesmente escrevi o que me veio à mente. boa sorte!

oh ... talvez, você também possa simplesmente fazer uma abordagem de contagem de quadrantes. para cada ano, divida sua área usando uma grade vetorial de 100x100m, conte pontos em polígonos e compare os dois padrões diferentes. apenas mais uma ideia ...

Jens
fonte
Jens, excelente análise do problema ecológico. Sua resposta sucinta identifica um problema sério com a abordagem do KDE e realmente ajudou no caminho a seguir.
Aaron
2

Uma mudança geral na vegetação pode ser calculada usando uma Análise de Mudança Digital. Para executar essa análise, primeiro você precisará de uma imagem de 4 bandas (R, G, B e NIR) para 1989 e 2009. Em seguida, usando um software de sensoriamento remoto (como ENVI ou Erdas), execute uma análise NDVI em cada imagem . A análise NDVI compara a proporção da banda NIR - banda vermelha / banda NIR + pixels da banda vermelha. O resultado dessa equação fornece valores de pixel que variam de -1 a 1. Os pixels que têm um valor menor que zero não mostram refletância na banda NIR. Da mesma forma, pixels com um valor maior que zero refletem a luz NIR e, portanto, são considerados vegetação. O processo de realizar uma análise de mudança digital é simplesmente subtrair uma imagem NDVI da outra (subtrair 1989 de 2009). Consulte o link abaixo para uma discussão mais aprofundada.

http://www.bioline.org.br/pdf?er07006

artwork21
fonte
Obrigado por uma resposta e referência instigantes. Os NDVIs foram criados a partir de 2009 NAIP DOQQs de 4 bandas para derivar localizações de árvores. No entanto, as imagens NAIP de 1 milhão de 1989 só estão disponíveis em escala de cinza - portanto, essas imagens tiveram que ser manipuladas de maneira diferente para obter as localizações das árvores. Pode haver muito "ruído de fundo" para este estudo usando NDVIs gerados a partir da MT ou outras imagens de baixa resolução para análise de alterações digitais. Obrigado novamente!
Aaron