Do polígono à medida contínua da diversidade?

11

Em primeiro lugar; Eu tentei encontrar uma pergunta semelhante, sem sucesso. Talvez seja porque eu sou novo no GIS e não sei exatamente o que estou procurando. Se alguém me indicar um problema semelhante, ficaria feliz em remover esta postagem.

Preciso criar uma variável 'contínua' ou raster (em pequenas células da grade) da diversidade populacional para um determinado país. Eu tenho um shapefile mostrando a disseminação dos grupos étnicos nos polígonos (fig. 1), e o resultado que estou procurando é o 'indicador médio de diversidade' em cada uma das unidades administrativas (AU, neste caso, o 360 círculos eleitorais nigerianos).

Fig.1 - Polígonos de grupos populacionais

Fig 1. Polígonos de grupos populacionais na Nigéria

A solução que encontrei foi obter a porcentagem de área de cada polígono em cada UA e calcular um índice de heterogeneidade a partir disso. Mas o problema é que eu deixaria de lado muitas informações devido à distribuição de unidades administrativas. Como mostrado na fig. 2, os quadrados 'a', 'b' e 'c' teriam o mesmo 'índice de segregação', mas é claro que eles não estão na mesma posição em relação aos 'pontos quentes'.

Figura 2

Figura 2.

Portanto, pensei que outras soluções poderiam ser criar um mapa de grade e calcular a distância até a borda mais próxima, mas novamente compartilhar apenas uma borda não é o mesmo que estar na parte central do mapa, onde vários grupos vivem juntos.

Depois de encontrar essa pergunta , acho que os polígonos poderiam ser transformados em pontos usando seus centróides e depois aplicar o mesmo método. Mas a verdade é que sou novo nisso, e essa pergunta não é realmente claramente respondida. Como eu pude fazer uma coisa dessas?

Usando outro exemplo, quero criar algo parecido com isto (imagens deste site ):

1 2

Dada a distribuição de alguns pontos com diferentes características qualitativas , obtenha uma medida da diversidade de onde eu poderia estimar a 'heterogeneidade média' de cada unidade administrativa.

Como eu pude fazer isso? Eu uso R e QGIS, então não me importo em qual plataforma é a solução.

Fran Villamil
fonte

Respostas:

5

Eu realmente daria uma chance ao SpatiaLite por fazer isso! Mais convenientemente, você pode usar o plugin QSpatiaLite no QGIS.

Basta configurar uma grade de polígono com um tamanho sensível para células de grade. Em seguida, cruze a grade com o polígono do grupo étnico e calcule a área de cada interseção. Com a tabela resultante, você pode calcular seus índices usando as áreas de interseção, que são áreas de grupos étnicos em cada célula da grade, como 'métrica de abundância' (é assim que um ecologista o chamaria)!

Assumindo que a camada de grupos étnicos é chamada 'EthnicGroups', com um campo 'group' e a grade de polígonos é denominada 'Grid' com um campo 'ID', esta consulta SQL se aplicaria:

SELECT 
  g.ID AS gID, 
  e.group AS egr,
  AREA(INTERSECTION(e.geometry, g.geometry)) AS egr_area
FROM Grid AS g JOIN EthnicGroups AS e 
ON INTERSECTS(g.Geometry, e.Geometry)
ORDER BY gID, egr_area ASC

Para calcular métricas de diversidade com fórmulas especiais, eu usaria R, recolhendo essas 'abundâncias', produzindo um valor para cada célula da grade, que finalmente poderia ser agregada às geometrias da grade!

Para obter sua diversidade média para cada UA, você pode usar os índices de diversidade aos quais se juntou à grade. Novamente, usando SpatialLite, agrupando os valores nos polígonos AU com a aplicação da função média.

Engraçado que recentemente escrevi um post de blog abordando esse problema, que pode lhe dar uma idéia: http://thebiobucket.blogspot.co.at/2014/12/usecase-find-dominant-species-and.html

No que me diz respeito, aconselho a pular a idéia de 'continuidade' a esse respeito, porque a diversidade só tem significado em relação à unidade espacial em que se baseia. Então, acho que todas as abordagens e técnicas sofisticadas que usam qualquer tipo de média ou interpolação sobre outras unidades além das unidades espaciais em que seus índices se baseiam não adicionarão nada valioso, mas obscurecerão o resultado!

Aqui está um mapa mostrando a diversidade de anfíbios (em vez de étnicos;) para os quais eu usei o mesmo método: insira a descrição da imagem aqui

ps: esse link pode ser interessante, se você quiser obter diversidade dentro de um determinado raio de pesquisa!

Kay
fonte
4

No QGIS, você pode gerar uma grade de pontos sobre seus polígonos. Você encontrará essa função em Vetor -> Ferramentas de pesquisa (acho que é chamado em inglês, minha versão do QGIS está em outro idioma.) Você precisará encontrar uma granularidade razoável quando se trata do espaçamento da grade de pontos.

Em seguida, no menu Vetor, você faz um atributo de associação por local (encontrado em Gerenciamento de dados), usando os pontos como destino e os polígonos de etnia como origem.

Agora você tem uma grade de pontos com um atributo de etnia para cada ponto.

Aqui é onde fica um pouco complicado. Você pode gerar uma varredura usando esses pontos, se recodificar seu atributo em um valor numérico (por exemplo, usando a ferramenta Criar campo numérico equivalente na caixa de ferramentas de processamento do QGIS.) Em seguida, você pode usar Criar grade em Varredura -> Análise. Aqui você pode experimentar a análise da média deslizante ou da vizinhança mais próxima. Em seguida, você pode usar as estatísticas da zona (existem várias opções na caixa de ferramentas Processamento, bem como no menu raster.)

O truque é como obter o índice de heterogeneidade enquanto ignora o valor arbitrário criado pela recodificação dos atributos em um índice numérico, mas você pode ter uma idéia própria aqui. Não tenho certeza de como fazer isso sem levar muito tempo do que eu deveria estar fazendo agora :)

Outra idéia é carregar sua grade de pontos em um banco de dados Spatialite (ou PostGIS, mas é uma operação maior para ser executada.) Em seguida, você pode usar as funções SQL e espaciais no banco de dados para testar, digamos, todos os pontos dentro de um raio definido de cada ponto para forneça um índice de variação local e, em seguida, gere uma varredura a partir desse valor. Eu trabalhei um pouco com isso recentemente.

Espero que isso te dê algumas ideias! Sinta-se livre para usar os comentários se quiser discutir mais.

hexamon
fonte
Muito obrigado!! Vou tentar resolvê-lo e retornarei para você se tiver mais problemas (com certeza o farei).
quer
2

Há uma série de suposições na sua pergunta que precisam ser abordadas antes de você chegar à questão da implementação. O exemplo que você fornece é uma análise de biodiversidade baseada em uma amostra de variedades de uma determinada espécie de planta. Examinei o manual do software usado para gerar essa varredura e não há indicação de que isso seja apropriado ou tenha sido aplicado a populações humanas. O centróide de uma área cultural humana (que você propõe usar para sua análise) não é de modo algum análogo a uma amostra (isto é, observação real) de uma coleção de plantas.

A proximidade de subgrupos humanos (divididos em qualquer dimensão, aqui a dimensão é etnia) pode ser expressa como uma medida de diversidade ou uma medida de segregação. Uma medida de diversidade amplamente utilizada é o índice de Herfindahl , que varia de 0 a 1 e é pequeno quando uma área possui muitos grupos pequenos e grande quando uma área possui muitos grupos grandes. É calculado dentro de uma população ou área sem referência a algo fora dessa população ou área. Isso é problemático, pois você está interessado em interação espacial através dos limites administrativos.

Uma medida de segregação amplamente usada é o índice de dissimilaridade , que varia de 0 a 1 e é pequeno quando as subáreas têm a mesma distribuição populacional da região maior e grande quando as subáreas são exclusivamente um grupo ou outro. Geralmente é calculado em uma região para a qual há informações demográficas disponíveis para muitas subáreas (por exemplo, você pode calcular o índice de dissimilaridade em preto e branco para a região metropolitana com base em dados demográficos para todos os setores censitários da região metropolitana). Wong (2002) modelou os locaissegregação calculando o índice de dissimilaridade para cada subárea com base na população de subáreas vizinhas (isto é, contíguas) e não na região como um todo. Uma limitação dessa medida é que ela só pode funcionar para dois grupos por vez. No entanto, usei-o em minha própria pesquisa usando os dois grupos mais populosos dentro de cada zona de vizinhos.

Você indicou que deseja calcular a diversidade para cada unidade administrativa (AU). Mas você também diz que precisa criar uma varredura contínua de diversidade. Não está claro para mim se você realmente deseja uma varredura contínua da diversidade ou se acha que precisa disso para calcular a diversidade da UA. Se você realmente deseja diversidade contínua, eu recomendaria dar uma olhada em O'Sullivan & Wong (2007) , que visualiza a diversidade contínua usando um estimador de densidade de kernel. Isso tem o efeito de contabilizar a interação da população através dos limites administrativos, que você indica que deseja.

OTOH, se você realmente deseja diversidade por unidade administrativa, pode fazê-lo usando o índice Herfindahl ou o índice local de dissimilaridade. Mas isso requer informações sobre características demográficas dentro de cada UA. Suponho que o motivo pelo qual você está usando o mapa de áreas étnicas seja porque você não possui dados de população étnica para as UAs. Mas se você conhece a população de cada UA e a intercepta com a grade de áreas étnicas, você pode alocar a população de UAs para áreas étnicas. A suposição importante com esta e as outras respostas propostas até agora é que elas assumem que a densidade populacional é constante em toda a UA ou na área étnica. Essa suposição parece prima facie implausível, mas você conhece os dados melhor do que eu e pode se sentir confortável com essa suposição.

Com base no meu entendimento de seus objetivos, acho que minha abordagem seria a seguinte:

  1. População modelo dentro de subunidades em que as subunidades podem ser a interseção de AUs e áreas étnicas, ou uma grade vetorial ou raster. Com tempo suficiente, eu gostaria de tentar nos dois sentidos.
  2. Calcule o índice de Herfindahl para cada UA, mas, seguindo Wong (2002), eu calcularia o índice de Herfindahl com base na vizinhança de cada UA, e não apenas na população da UA. Com tempo suficiente, eu experimentaria bairros com base em contiguidade e distância.

Obviamente, nada disso chega à implementação técnica, mas se você me der algum feedback sobre isso, podemos seguir em frente.

PS: Os trabalhos acadêmicos aos quais vinculei estão fechados. Se o OP não tiver acesso a uma biblioteca acadêmica, sinta-se à vontade para entrar em contato comigo por e-mail e eu os fornecerei.

Lee Hachadoorian
fonte
+1 Talvez não seja tecnicamente detalhado, mas ainda assim muito útil e informativo!
Joseph