Ferramentas de estatística espacial: análise de cluster em dados raster

9

Eu tenho um problema aparentemente simples, mas não consigo encontrar uma metodologia clara para usar.

Tenho a tarefa de delimitar "áreas urbanas" por polígonos convexos de vetor, usando o conjunto de dados População Grelhada do Mundo do CIESIN

Esse conjunto de dados fornece valores de densidade populacional em todo o mundo, como um arquivo raster. O problema é, como você já adivinhou, que os valores da densidade estão mudando muito e a definição de "urbano" é bastante relativa.

Tentei usar uma abordagem clássica e calculei as inclinações como se os valores da densidade fossem altitudes, mas os valores das inclinações também eram muito díspares e complexos espacialmente, intricados.

Analisei algoritmos de agrupamento espacial, ferramentas LISA (Indocators Locais da Spatial Association), com ArcGIS e GeoDa, mas estou bastante perdido entre ferramentas muito específicas. Alguns dos métodos estão trabalhando apenas em formas vetoriais; portanto, são necessárias uma reclassificação e uma vetorização (computação longa).

Você pode me ajudar a refinar o conjunto de métodos e ferramentas a serem usados? Obrigado !

Laurent Jégou
fonte
2
Qual é exatamente a sua definição de "urbano"? Aliás, eu não esperaria que todas as áreas urbanas fossem adequadamente descritas por polígonos convexos . Muitos têm formas controladas por características geográficas - montanhas, linhas costeiras e rios - que são altamente não convexas.
whuber
A definição não é dada, não é uma constante. Penso que o objetivo é encontrar áreas substancialmente mais densas em relação ao ambiente, o que varia. Então, a idéia sobre estatística espacial e LISA. Você está certo sobre a convexidade, eu deveria ter escrito "não se auto-intercepta e não se interpõe com outros polígonos".
Laurent Jégou
Como complemento, encontrei um módulo R inteiro dedicado a ferramentas de aglomeração espacial: spdep.
Laurent Jégou

Respostas:

4

Eu trabalhei nisso no meu mestrado http://ian01.geog.psu.edu/papers/mscthesis.pdf - basicamente trabalhei em alterações gradientes, mas a discussão pode ajudá-lo.

Ian Turton
fonte
Obrigado, vou lê-lo em breve, mas que está prometendo :-)
Laurent Jégou
Eu tentei o método derivado duplo de Sobel 2 que você descreve na tese, em uma zona de teste limitada, e é muito interessante! Núcleos urbanos claros são isolados, apesar de valores de densidade muito diferentes. Muito obrigado :) A propósito, usei um software livre e de código aberto para calcular as convoluções e a matemática de varredura: Opticks.
Laurent Jégou 22/03
Uma medida de luz artificial seria um bom substituto para as condições urbanas. Uma pesquisa no google deve encontrar exemplos de estudos.
b_dev
@indiehacker - Eu olhei para isso, mas é culturalmente dependente, a França, por exemplo, é muito mais sombria que o Reino Unido.
Ian Turton
6

Do ponto de vista da densidade populacional, uma "área urbana" geralmente deve satisfazer apenas alguns critérios axiomáticos :

  1. Seu limite não deve incluir pontos de densidade (relativamente) alta em comparação com a densidade máxima em seu interior.

  2. Deve ser simplesmente conectado (sem "orifícios").

  3. Sua densidade populacional média deve exceder algum limite pré-especificado.

O axioma (1) é o mais natural: se um ponto de limite tivesse uma alta densidade, apenas moveríamos o limite para fora para incluir esse ponto na área urbana. Eu gostaria de sugerir que "relativo" significa como uma proporção do máximo , como um décimo ou centésimo ou qualquer outra coisa. O Axiom (2) evita a exclusão de parques e outras regiões de baixa densidade que ocorrem naturalmente nas cidades. O axioma (3) , que por depender de um limiar é algo arbitrário, elimina pequenas aldeias compactas.

Na verdade, há pelo menos outro elemento de arbitrariedade: qualquer mapa em grade da densidade populacional calcula a média das populações nas vizinhanças locais (igual a uma célula em alguns casos e igual a um raio do núcleo para estimativas de densidade do núcleo). Vamos aceitar esse tamanho implícito de vizinhança (que pode ser alterado pela primeira vez que os meios focais ou outro kernel suavizam o mapa de densidade original), esse limite de população e a sensação de "relativamente alto" no axioma 1 como parâmetros configuráveis ​​pelo usuário que controlam o resultado.

Esses axiomas levam naturalmente a um algoritmo bastante simples : é preciso localizar os máximos locais, procurar nas vizinhanças até encontrar um limite que satisfaça o axioma (1), preencher todos os buracos para satisfazer o axioma (2) e, em seguida, filtrar todas essas áreas candidatas de acordo com (3). Isto se faz do seguinte modo:

  1. Opcionalmente, alise o mapa de densidade.

  2. Execute um algoritmo de "preenchimento" em um mapa relacionado à densidade (veja abaixo).

  3. RegionGroup o resultado.

  4. Remova os furos dos polígonos do RegionGrouped.

  5. Execute somas zonais da densidade populacional sobre os polígonos preenchidos.

  6. Elimine todos os polígonos com somas (ou densidades médias) abaixo do limite da população (densidade).

O que resta é a sua solução.

Deixe-me dizer um pouco mais sobre o passo (1), que é fundamental. Um algoritmo de preenchimento identifica "sumidouros" e os "preenche" até uma quantidade constante acima de suas elevações. É exatamente isso que o Axioma (1) nos pede para fazer, desde que (a) possamos fazer com que "afundar" desempenhe o papel de "máximo local" e (b) fazer com que "quantidade constante acima" desempenhe o papel de " fração constante de. " A maneira de fazer isso é preenchendo o logaritmo negativo da densidadeao invés da densidade em si. (Adicione uma pequena constante primeiro à densidade - digamos, cerca de 0,1 pessoa por quilômetro quadrado - antes de registrar o log, para que quaisquer células que contenham zeros não causem problemas.) Os "lagos" na densidade negativa de log identificam candidatos áreas urbanas. Você ainda tem três parâmetros independentes para brincar (inserindo as etapas 0, 1 e 5); defini-los exigirá uma reflexão sobre o que você realmente entende por "área urbana", bem como algumas experiências.

whuber
fonte
Obrigado pela sua resposta detalhada. Vou tentar encontrar as ferramentas de software certas (ou programá-las) para testar o algoritmo de preenchimento com o log negativo, o que parece ser um bom resultado.
Laurent Jégou 22/03