Não sou de modo algum bom em estatística, mas acho que vim ao lugar certo. Minha pergunta é simples:
Meu problema consiste em comparar a população de vários estados em um país pequeno, mas alguns estados têm uma população de 3000.000 e outra de 2.000.
Estou pintando em um mapa, e a "intensidade" da cor depende de como a população de cada estado se compara à população de todo o país.
O problema é que os estados com muita população são mostrados com cores realmente intensas e os estados pequenos quase não têm cor.
Existe uma maneira fácil de "normalizar" ou tornar os dados comparáveis?
Não sei se estou me explicando direito, mas espero que alguém possa me ajudar. Por favor, comente se minha pergunta não estiver clara e eu vou esclarecer.
Obrigado pela ajuda!
fonte
Respostas:
Sinto muito, mas para mim parece que você está tentando consertar o que não está quebrado. Na verdade, você pode até estar tentando quebrar o que não está quebrado. Quando você tem uma variável quantitativa (aqui, população) que abrange um amplo intervalo, qualquer métrica usada para representá-lo também deve abranger um amplo intervalo.
Mas, para todas as coisas relacionadas à cor (e especialmente aos mapas), a principal fonte é, eu acho, o ColorBrewer
fonte
Boa pergunta: uma solução é redimensionar as cores para distribuí-las de maneira mais uniforme ou para uma distribuição com caudas mais baixas ... mas sua lenda precisa ser clara o suficiente, porque deformar a escala, de alguma forma, é injusto ...
Por exemplo, em R, redimensionando um normal para um uniforme. (o que você tem talvez seja mais diferente, pois você tem caudas grandes e as deseja menores, mas o princípio é o mesmo)
fonte
Você pode dividir pela população total. Isso garantiria que tudo fique entre 0 e 1. Se as escalas ainda forem muito díspares, considere uma escala de log.
fonte
Sinto-me desconfortável ao perguntar, mas você está realmente comprometido em usar cores para retratar uma quantidade quantitativa? Não há como colocar uma barra em cada estado, cuja altura representa a quantidade?
Outra maneira pode ser mostrar o mapa com áreas que representam as áreas geográficas, juntamente com um mapa em que a área de cada estado é proporcional ao tamanho da população - semelhante à maneira como o homúnculo sensorial o faz. Mas isso seria uma quantidade dolorosa de desenho - não conheço nenhuma maneira de automatizar isso (embora possa existir)
fonte
Seu objetivo declarado:
Seu problema declarado:
Objetivo de normalizar seus dados antes de mapear
Essa resposta estará faltando, pois não tenho certeza do contexto de por que você está fazendo o mapa.
No entanto, aqui estão algumas idéias para explorar: Normalize seus dados para que o mapa forneça um significado interessante aos leitores em potencial do mapa, para que eles possam vincular o que vêem no mapa a algum conceito em que normalmente pensam. Basicamente, acho que seus novos números normalizados devem estar ligados a algum conceito qualitativo que os leitores de mapas acham interessante entender (petisco aleatório: Medida = Quantidade x Qualidade, Hegel).
Duas maneiras propostas para normalizar seus dados
1. Para dar uma noção de quanto espaço aberto existe em cada estado.
Crie uma nova variável de estado para a densidade populacional calculando a população dividida pela área total do estado.
2. Para fazer a coloração dos estados contrastar entre si.
Crie uma nova variável de estado calculando o desvio da média de cada estado. Por exemplo, digamos que você tenha 3 estados com populações da seguinte maneira:
A média será de cerca de 50.
Os valores da nova variável para cada estado serão os seguintes:
Você pode usar qualquer esquema de cores em que números positivos contrastem com números negativos (google 'colorbrewer' para muitos exemplos de esquemas de cores para mapas).
fonte