Cálculo da correlação espacial entre recursos de duas camadas separadas no QGIS

10

Estou tentando determinar se a presença de um grande número de tropas militares ativas em uma área está espacialmente correlacionada com níveis mais altos / mais baixos de crimes violentos. Ou seja, as áreas que cercam grandes bases militares são mais / menos violentas, em média, do que áreas que não estão próximas de bases militares?

Estou trabalhando com os dois conjuntos de dados a seguir:

(1) um conjunto de dados pontuais de bases militares nos EUA continentais e seus níveis de tropas correspondentes:

Localizações de instalações militares dos EUA nas 48 regiões

(2) um conjunto de dados nacionais sobre taxas de crimes violentos por cidade / cidade:

Níveis de crimes violentos nos EUA por cidade

Sinto que estou procurando algum tipo de modelo baseado em gravidade, em que a função "massa" fornece níveis de tropas em cada base. Portanto, uma grande presença de tropas exerceria influência sobre uma área maior e teria um efeito mais forte próximo ao centro de massa (isto é, a localização do ponto na camada GIS).

Eu estou pensando que, conceitualmente, seria algo como isto: modelo de gravidade - diagrama de decaimento à distância

Neste diagrama , X, Y, Z representam bases militares. a, b, c, d representam cidades (cada uma com um campo de taxa de violência em sua tabela de atributos).

O gradiente ao redor das bases representa o campo de influência, que diminui exponencialmente com a distância do centróide da base. A presença maior de tropas equivale a um raio de influência maior (com alguma distância máxima do limiar) e também a uma influência mais forte nas proximidades do centro em relação às áreas próximas a uma base menor.

A cada cidade será atribuída uma pontuação com base na soma da magnitude de todos os vetores de "força" de todas as bases circundantes, cujo raio de influência está localizado. Por exemplo, no meu diagrama, a Cidade a teria uma pontuação 0, pois fora do raio de qualquer base. Cidade b só seria influenciada pela base de X . Cidade c só seria influenciada pela base de dados de Z , e sua pontuação seria menor do que b , desde que X é uma base muito maior do que Z . Finalmente, a cidade d está dentro do raio de ambas as bases X e Y, receberia uma pontuação com base na soma da magnitude da influência de ambas as bases. Eu veria se existe uma correlação entre a pontuação mais alta de uma cidade e as taxas mais altas de violência.

Eu estive pesquisando vários modelos baseados em gravidade ( Huff Models , etc.), mas não consegui encontrar tanto quanto QGIS / Python, e não tenho muita certeza de como implementar o que descrevi acima ... Alguém tem sugestões? por esta? Algum de vocês já fez esse tipo de análise em outras áreas antes?

Portanto, o TLDR é:

  • Que técnicas estatísticas eu poderia usar para esse tipo de pergunta?
  • Existem ferramentas embutidas no QGIS (ou disponíveis como plug-ins) que podem fazer isso?
  • Se não houver nada parecido com isso no QGIS, existem bibliotecas Python que podem executar esse tipo de análise?
J. Taylor
fonte
Só para esclarecer, estou ciente de que existem muitos outros fatores que entram em jogo com as taxas de violência (pobreza, densidade urbana, etc.), mas, por uma questão de simplicidade, assuma que não havia variáveis ​​de confusão significativas e que eu estava apenas olhando para a correlação entre essas duas variáveis ​​(níveis de tropas e taxas de violência). Neste ponto, este é apenas um exercício de aprendizado e estou tentando descobrir quais ferramentas estão disponíveis para mim. Obrigado!
J. Taylor
1
Para responder à sua terceira pergunta, encontrei o PySAl, desenvolvido pelo Prof Luc Anselin, que vale a pena procurar, considerando seus interesses. Ele também trabalhou no GeoDa, que é uma solução pronta para uso para o que você está procurando. Pode haver um plugin PySAl para QGIS? pysal.readthedocs.org/pt/latest
raphael

Respostas:

2

Expandindo meu comentário acima

O que você provavelmente vai querer fazer é executar uma regressão linear com atraso espacial, o que explica a correlação espacial de algumas de suas variáveis ​​(vou precisar ver minhas anotações sobre isso).

Luc Anselin foi pioneiro nesse espaço, e você deve dar uma olhada no trabalho dele, especialmente nas ferramentas e documentação (gratuitas) do Centro GeoDa . Essas duas ferramentas podem ser do seu interesse:

  1. GeoDa, um software independente para explorar a correlação espacial (automática).
  2. PySAL , uma biblioteca de análise espacial do Python.

Minha busca por um plugin PySAL para QGIS encontrou algo que não é atualizado há anos, mas você pode ter mais sorte.

raphael
fonte
Obrigado Raphael. Examinarei mais o conceito de "regressão linear com atraso espacial". Eu já havia encontrado o PySAL / GeoDa graças a uma recomendação no canal de IRC #qgis. Você está certo de que grande parte da documentação na página GeoDa foi útil. Ainda não encontrei nada que faça exatamente o que quero, mas se eu mesmo tiver que codificá-lo, existem muitas ferramentas que parecem úteis "blocos de construção".
J. Taylor