Dados dados pontos com longitude, latitude e um terceiro valor de propriedade desse ponto. Como posso agrupar pontos em grupos (sub-regiões geográficas) com base no valor da propriedade? Eu procurei pelo google e descobri que esse problema parece ser chamado de "agrupamento espacial restrito" ou "regionalização". No entanto, não estou familiarizado com o tratamento de dados geográficos e não tenho uma idéia sobre que tipo de algoritmos são bons e quais pacotes python / R são bons para esta tarefa.
Para dar uma idéia mais intuitiva sobre o que eu quero, digamos que meus gráficos de dispersão de dados sejam os seguintes:
Portanto, cada ponto é um ponto, x é longitude, y é latitude e o mapa de cores mostra se o valor é grande ou pequeno. Quero dividir esses pontos em sub-regiões / grupos / clusters com base na localização e semelhança de valores. Como o seguinte (não é exatamente o que eu quero, apenas para mostrar uma ideia intuitiva.):
Então, como posso conseguir isso?
fonte
Respostas:
O pacote rioja fornece funcionalidade para armazenamento em cluster hierárquico restrito. Para o que você considera "restrito espacialmente", você deve especificar seus cortes com base na distância, enquanto que para "regionalização" você poderá usar k vizinhos mais próximos. Eu recomendo projetar seus dados para que estejam em um sistema de coordenadas baseado em distância.
fonte