Exibição eficaz de dados demográficos em um mapa impresso

29

Gostaria de plotar os seguintes dados por zona (total de 30 zonas) em um mapa imprimível / não interativo:

  • Idade Média
  • Renda familiar media
  • Número de famílias
  • Densidade populacional
  • Número de pessoas
  • Número de trabalhadores

Como você exibia as 6 camadas acima efetivamente em um mapa?

dassouki
fonte
1
Qual o tamanho das zonas em relação ao tamanho da página? Você pode encaixar uma pequena parcela em cada zona? (por exemplo, um gráfico de radar)
djq
de @celenius -É um tipo típico levantamento censitário, onde as zonas do centro são muito menores do que as zonas residenciais que são significativamente menores do que as zonas suburbanas / rurais
dassouki
1
Essas 6 camadas em um mapa estático são um trabalho de design difícil. Qual é o problema que impede o uso de um mapa interativo?
Trevesy
@Trevesy - em sua maior parte, a exigência é projetar um mapa para impressão que destaca a 6 variáveis para promover a análise visual
dassouki
1
Tomei a liberdade de adicionar a tag de visualização. Sinta-se à vontade para removê-la, se você achar que é inapropriado.
Andy W

Respostas:

20

Eu diria que você não pode incluir todos esses dados em um mapa e fazer algum sentido. Eu recomendo que você pense na linha do princípio de pequenos múltiplos da Tufte, tendo vários mapas menores da mesma área, cada um usando uma variável diferente. Exemplo: http://www.juiceanalytics.com/writing/better-know-visualization-small-multiples/

Mesmo assim, você tem o problema de usar várias unidades diferentes e precisa de várias chaves. Outra maneira de visualizar os dados (mas não em um mapa) seria usar uma tabela com todos os valores, coloridos (ou seja - cores diferentes para abaixo da média, média, acima da média)

Também recomendamos que você consulte o atlas do censo para obter mais idéias de mapas: http://www.census.gov/population/www/cen2000/censusatlas/

Pode ajudar a refletir mais sobre qual mensagem você está tentando comunicar, exatamente (e não apenas quais dados você possui).

Neuhausr
fonte
5
+1 Isso é muito melhor do que fazer uma bagunça, tentando simbolizar seis variáveis ​​ao mesmo tempo. Além disso, por que não imprimir uma tabela dos dados? Seis colunas + id, 30 linhas: é suficientemente pequeno e fornece todos os detalhes de que alguém precisa.
whuber
13

Não é possível mostrar com eficiência tantos dados em um único mapa. Duas possibilidades:

  • Produza 6 mapas,

  • Analise seus dados para classificar suas regiões e exiba o resultado da classificação. Uma análise de componentes principais pode ajudar a determinar as correlações mais importantes dentro de sua variável. Este método foi usado para produzir este mapa sintético:

texto alternativo

destes:

texto alternativo texto alternativo

julien
fonte
O problema de ter 6 mapas é que é difícil determinar visualmente quaisquer tendências. Às vezes, é bom olhar para um mapa com múltiplas variáveis e ver como as coisas se alinham
dassouki
2
@dassouki, para ver como as coisas se alinham, você não precisa necessariamente mapeá-las. Os gráficos de dispersão bivariados atenderiam a esse critério e seriam muito mais fáceis de interpretar.
Andy W
3
A vantagem de ter 6 mapas é que é fácil identificar tendências visualmente! Quando você tenta agrupar seis (ou mais) variáveis ​​em um único mapa, pode ser difícil encontrar padrões. (Se este mapa envolvesse milhares de recursos, eu alteraria essa observação: certos tipos de mapeamento, como a visualização de glifos , podem ser notavelmente eficazes para encontrar padrões em conjuntos de dados ricamente multivariados: lmi.bwh.harvard.edu/papers/papers/ KindlmannTVCG2006.html )
whuber
@julien, Coisas legais, você pode estar interessado neste artigo que acabei de encontrar, e-publications.org/ims/submission/index.php/AOAS/user/… , ele tem mapas com análises de PCA associadas de variáveis ​​múltiplas similares dados, bem como código R para fazer os gráficos.
Andy W
Muito interessante, vou ter que ler sobre isso.
neuhausr
9

Concordo que pequenos múltiplos provavelmente são uma boa maneira de abordar esse problema. Para complementar o mapa, eu também sugeriria uma matriz de dispersão de suas variáveis, que identificaria correlações bivariadas. Enquanto você perde o aspecto geográfico dos seus dados, é muito mais simples visualizar os relacionamentos entre variáveis ​​em um gráfico de dispersão do que comparar dois mapas (mesmo lado a lado).

Se você ainda deseja capturar algum tipo de tendência espacial, pode incluir estatísticas espaciais (como o I local de Moran) entre as distribuições e / ou as variáveis ​​originais.

Edit: Eu encontrei recentemente alguns trabalhos revisando as estatísticas morais publicadas por Andre-Michel Guerry (originalmente em 1883) que têm o objetivo de visualizar relações multivariadas no espaço. As implementações desses autores são muito semelhantes às sugeridas neste encadeamento, múltiplos pequenos, análise de componentes principais, matrizes de plotagem de dispersão e dentro de diagramas de polígonos. Em anexo estão algumas fotos de A.-M. Estatísticas Morais de Guerry na França: Desafios para Análise Espacial Multivariável por: Michael Friendly Statistical Science, vol. 22, n ° 3. (agosto de 2007), pp. 368-399 (O PDF é gratuito). Outro artigo ( Dray e Jombart, 2010 ) analisa os mesmos dados e possui algum código-fonte em R para fazer esses gráficos.

Uma imagem é uma matriz de gráficos de dispersão, a outra é o que é chamado de diagrama em estrela (que é apenas uma maneira diferente de representar gráficos de barras, como sugeriu Pablo). texto alternativo texto alternativo

Andy W
fonte
8

Aqui está um exemplo maravilhoso de pequenos múltiplos publicados na modelagem estatística, inferência causal e ciências sociais de Andrew Gelman (e blog da empresa) . O mapa é de apoio do eleitor aos vales-escola por estado, condicionado à renda e a várias categorias de raça e religião. Não evangélicos brancos realmente não gostam de cupons escolares! (Se você for ao blog atual, embora apareça nos dados da pesquisa de 2004, é mais um suporte para cupons escolares nesse grupo). insira a descrição da imagem aqui

Andy W
fonte
O gráfico é legal, mas a escala de cores é horrível. Por que 50% é tão priorizado, tornando-o cinza? Certamente deve usar apenas cores do mapa de calor, ou algo assim? Além disso, por que apenas as pessoas são divididas em religião? certamente faria mais sentido dividir por raça e depois por religião?
naught101
@ naught101, estou um pouco confuso com a sua negatividade. Certamente o cinza é enfatizado em comparação com as cores mais brilhantes ou mais escuras em cada extremidade do espectro. Enquanto eu sou abivalente quanto à divergência arbitrária de 45%, a IMO ao fazer pequenos mapas múltiplos como esses é benéfico ter valores altamente contrastantes. O comentário sobre as divisões religião / raça também não faz muito sentido. Essas são categorias obviamente muito relacionadas ao fato de um indivíduo oferecer suporte a vouchers, e parece que alguns dos subconjuntos que você sugere não existem. cont ...
Andy W
Ou seja, duvido que exista "católicos negros" suficientes na pesquisa para dizer algo substantivo sobre esse grupo (nem "protestantes hispânicos não evangélicos). Sugiro que você leia o post de Gelman e espero que isso esclareça a motivação para os subgrupos #
Andy W
talvez seja apenas aquele cinza em particular na minha tela. Eu acho que seria melhor com branco, e talvez um fundo cinza para diferenciá-lo. Também vale a pena notar que as duas imagens no blog de Gelman têm escalas diferentes ... Fiquei com a impressão de que a população negra era muito maior, mas apenas olhei para os dados do censo e fiquei corrigida. Uma coisa estranha, porém, é que o censo define a origem hispânica como ortogonal à raça (é uma pergunta à parte). Eu acho que as distinções de Gelman são definidos de forma diferente ..
naught101
@ naught101 isso não é informação do censo, é de alguma outra pesquisa (o censo não tem nenhuma opinião pública) #
Andy W
5

Para escolher entre as soluções apresentadas aqui, você pode fornecer duas informações principais:

  • qual é o objetivo do mapa? (Descobrir, expor?)
  • qual é o público-alvo do mapa? (Vocês, colegas analistas, urbanista, público?)

As soluções citadas aqui podem ter eficiência diferente de acordo com a finalidade e o público.

Eu gostaria de generalizar a resposta de Julien (um mapa sintético por meio de um PCA) citando a técnica da diagonalização da matriz, descrita por J. Bertin. É útil quando se busca uma síntese de todas as informações, em vez de uma apresentação completa dos dados.

Em resumo, consiste em representar cada variável com um histograma, classificar e empilhar os histogramas de forma que os valores (as zonas do mapa) sejam alinhados na diagonal, para obter uma tipologia:

texto alternativo

(Fonte: http://books.google.com/books?id=2tlQAAAAMAAJ&dq=bertin%20graphique%20information&hl=fr&source=gbs_similarbooks )

Laurent Jégou
fonte
4

São muitas informações e é fato que um único mapa combinando todos eles de maneira temática resultaria em uma apresentação inútil por causa da poluição visual. Por outro lado, existem 30 zonas, portanto, muitos mapas para cada zona também resultariam em poluição.

Minha solução: escolha qual é a informação mais importante, digamos 'renda familiar', depois coloque o mapa em algumas categorias de renda. E, finalmente, para cada ponto de renda, planeje um bate-papo com os outros cinco atributos.

Com esse mapa pode-se fazer algumas comparações como, por exemplo: "Áreas de alta renda sempre mostram grande número de trabalhadores e uma idade média de mais de 21 anos".

Olhe para o exemplo...

texto alternativo

Pablo
fonte
4

Talvez algumas dessas idéias possam ajudar?

Supondo que você tenha seis dimensões:

1: Coropletas : exemplo de renda familiar 0

2, 3 e 4: Símbolos : representando o número de pessoas como pontos, o que permite ver o plano de fundo: exemplo 1, exemplo 2 usando escala de cinza para trabalhadores / não trabalhadores e um esquema de cores diferente para mostrar a idade

5: 3D : Usando a densidade populacional como exemplo de terreno 3

6: (Não consigo pensar na sexta maneira!)

É redundante mostrar 'Número de famílias', 'Densidade populacional' e 'Número de pessoas'?

Eu ficaria cético se um mapa com essa complexidade fosse claro para qualquer um além de você. Se eu o estivesse apresentando, mostraria cada elemento separadamente primeiro e depois o adicionaria para que o público entenda as etapas.


Uma maneira alternativa (se você não tiver espaço para um gráfico de radar para cada zona, pode ser criar um 'glifo' que representa esta informação, exemplo 4, fig 10.28 . claramente, mas o exemplo vinculado pode ser usado neste caso.


Outro pensamento que tive foi extrudar os polígonos para a mesma altura para cada polígono e, em seguida, usar uma seção da altura para representar esses parâmetros. É semelhante à criação de um gráfico de barras para cada área, mas onde cada seção é colocada em camadas no topo em intervalos semelhantes. Isso precisaria ser visualizado em 3D, o que significaria que alguns deles seriam obscurecidos.

djq
fonte
Eu amo e quero dizer todas as suas sugestões. Eu planejo implementar 1-> 4. No entanto, para o material 3d: Eu acho que quando você faz mapas 3D, áreas centrais, geralmente localizadas centralmente obter a maioria da elevação, bloqueando muitas zonas por trás deles
dassouki
@dassouki - Concordo que geralmente é o caso. Talvez você possa usar uma variável que não possua uma faixa enorme para isso (idade média?) Ou, se houver, poderá transformá-la logaritmicamente.
DJQ
3
@celenius Pergunta interessante sobre possível redundância: densidade populacional é o número de pessoas em relação à área ; número de pessoas é uma contagem absoluta ; e número de famílias fornece informações sobre como as pessoas vivem juntas. Embora claramente essas três variáveis ​​estejam relacionadas (e possam criar problemas de quase colinearidade nas regressões), elas realmente são três informações diferentes. Aliás, é "choropleth". (Felizmente, o Google reconhece esse erro de digitação e faz a pesquisa pretendida de qualquer maneira.)
whuber
1
@ Whuber - Eu acho que provavelmente é feito usando flash (infelizmente!).
DJQ
2
Suspeito muito da sugestão de 3D. AFAIK ninguém mostrou 3D é muito utilizável. O vínculo com o crime de San Francisco funciona, mas apenas porque é muito simples - seria difícil decifrar um padrão mais complexo. Não acho que 3D seja o caminho a seguir neste caso.
Trevesy
2

É uma tarefa desafiadora. Minha resposta é ir com um mapa multivariado. Confira este mapa . O mapa ficará ocupado se você mostrar todas as variáveis ​​em um mapa. Certifique-se de selecionar o esquema de cores apropriado se optar por usar um mapa multivariado.

Raj
fonte
O Google Docs está bloqueado onde trabalho :(
dassouki
não quer trabalhar e eu não posso raspar-lo se ele não tem uma extensão de arquivo no final dela
dassouki
Ainda não vai ....
dassouki
Isso está a um quarteirão do meu lado. :( Não me importo de lhe enviar o mapa por e-mail.
Raj
0

Um grau de simplificação seria expressar um item, como a densidade populacional, através de um cartograma, ou seja, distorcer a área de cada unidade para que seja proporcional à população:

Eleição presidencial dos EUA em 2008
(fonte: amherst.edu )

A principal desvantagem é que o visualizador deve ser capaz de reconhecer a distorção das zonas de suas formas "usuais".

Mais informações aqui: http://gis.amherstma.gov/data/SpringNearc2009/Session4Cartograms.pdf

Andy
fonte
1
Eu acho que isso tem potencial, mas não está claro o quão bem os cartogramas podem ser aplicados a essa situação específica (visualizando simultaneamente vários atributos no mesmo espaço). Teoricamente, você poderia criar muitos pequenos cartogramas múltiplos, mas pode ser difícil de interpretar (você perde a consistência entre os mapas, o que é essencial para pequenos múltiplos). Talvez o cartograma possa ser combinado com cores de maneiras mais interessantes para mostrar vários atributos.
Andy W
1
Um exemplo de pequenos cartogramas múltiplos, gisandscience.com/2011/12/07/…
Andy W