Foi realizado algum estudo sobre qual o melhor conjunto de cores a ser usado para mostrar várias séries no mesmo gráfico? Acabei de usar os padrões matplotlib
, e eles parecem um pouco infantis, pois são todas cores vivas e primárias.
data-visualization
David Hollman
fonte
fonte
Respostas:
Uma referência comum para a escolha de uma paleta de cores é o trabalho de Cynthia Brewer no ColorBrewer . As cores foram escolhidas com base em padrões de percepção nos mapas de coropletas, mas a maioria dos mesmos conselhos se aplica ao uso de cores em qualquer tipo de gráfico para distinguir os padrões de dados. Se a cor é apenas para distinguir entre as diferentes linhas, uma paleta qualitativa está em ordem.
Frequentemente, a cor não é necessária em gráficos de linhas com apenas algumas linhas, e diferentes símbolos de pontos e / ou padrões de traço são eficazes o suficiente. Um problema mais comum nos gráficos de linhas é que, se as linhas se sobrepuserem com frequência, será difícil distinguir padrões diferentes, independentemente dos símbolos ou cores que você usar. Stephen Kosslyn recomenda uma regra geral por ter apenas 4 linhas em um gráfico. Se você considerar mais, divida as linhas em uma série de pequenos lotes múltiplos. Aqui está um exemplo mostrando a recomendação
Nenhuma cor é necessária e os rótulos são mais que suficientes.
fonte
Muitos conselhos excepcionalmente bons em outras respostas, mas aqui estão alguns pontos extras de meus próprios conselhos de nível inferior para os alunos. Tudo isso é apenas um conselho, naturalmente, a ser pensado, dadas as principais perguntas: O que meu gráfico pretende fazer? O que faz sentido com esses dados? Quem são os leitores? O que espero que as cores façam dentro do gráfico? O gráfico funciona bem, independentemente dos dogmas de outra pessoa?
Além disso, a importância da cor varia enormemente de um gráfico para outro. Para um mapa de coroas ou patches, no qual a ideia é de fato que áreas diferentes sejam coloridas ou pelo menos sombreadas de maneira diferente, o sucesso de um gráfico está associado ao sucesso de seu esquema de cores. Para outros tipos de gráficos, as cores podem ser dispensáveis ou até mesmo um incômodo.
Suas cores são todas necessárias? Por exemplo, se diferentes variáveis ou grupos são claramente distinguidos por rótulos de texto em diferentes regiões de um gráfico, cores separadas também costumam ser um exagero. Cuidado com os efeitos da salada de frutas ou do revestimento de sonho tecnicolor. Para um gráfico de pizza com rotulagem de texto nas fatias ou nas fatias, a cor não fornece informações adicionais, por exemplo. (Se seu gráfico depende de uma chave ou legenda, é provável que você esteja tentando o tipo errado de gráfico.)
Nunca confie no contraste entre vermelho e verde, pois muitas pessoas lutam para distinguir essas cores.
Seqüências de arco-íris (ROYGBIV ou vermelho-laranja-amarelo-verde-azul-índigo-violeta) podem apelar por motivos físicos, mas na prática não funcionam bem. Por exemplo, o amarelo é geralmente uma cor fraca, enquanto o laranja e o verde são geralmente mais fortes, portanto a impressão nem é uma sequência monotônica.
Evite qualquer esquema de cores que tenha como consequência grandes manchas de cores fortes.
Uma sequência de vermelho escuro a azul escuro funciona bem quando é necessária uma sequência ordenada. Se o branco é (como sempre) a cor de fundo em qualquer lugar, não o use, mas pule de vermelho pálido para azul pálido. [adicionado em 1 de março de 2018] Talvez seja óbvio demais para sublinhar: o vermelho tem conotações negativas e / ou perigosas para muitos, o que pode ser útil, e o azul pode significar positivo. É óbvio demais para sublinhar, mas faço de qualquer maneira: vermelho e azul têm conotações políticas em muitos países.
Azul e laranja vão bem juntos (um aceno agradecido a Hastie, Tibshirani e Friedman aqui: http://web.stanford.edu/~hastie/local.ftp/Springer/OLD/ESLII_print4.pdf ) [adicionado em 1 de março de 2018] os livros introdutórios sobre visualização agora recomendam laranja, azul e cinza como uma paleta básica: laranja e / ou azul para o que você gosta e cinza para o pano de fundo.
A escala de cinza de cinza claro a cinza escuro pode funcionar bem e é uma boa idéia quando a reprodução de cores está fora de questão. (É uma impressora péssima que não pode fazer uma festa justa em escala de cinza.) (Cinza, se você preferir; as preferências mudam nos oceanos, ao que parece; assim como ocorre com as cores.)
[adicionado em 5 de agosto de 2016] Um princípio bastante geral é que geralmente duas cores funcionam muito melhor do que muitas. Se dois grupos forem de interesse, escolha cores igualmente fortes (por exemplo, vermelho ou laranja e azul). Se um grupo é de particular interesse entre vários, faça-o azul ou laranja e deixe os outros serem cinza. Usar sete cores para sete grupos, em princípio, carrega a informação, mas é difícil até se concentrar em uma cor por vez, quando há concorrência de várias outras. Múltiplos pequenos podem ser melhores para vários grupos do que um gráfico multicolorido.
fonte
Na verdade, tem havido muita pesquisa sobre isso nos últimos anos.
Um grande ponto é "ressonância semântica". Isso basicamente significa "cores que correspondem ao que representam", por exemplo, uma série temporal de dinheiro deve ser verde, pelo menos para uma audiência nos EUA. Aparentemente, isso melhora a compreensão. Um artigo muito interessante sobre o assunto é de Lin, et al (2013): http://vis.stanford.edu/papers/semantically-resonant-colors
Há também o ótimo gerador de cores iWantHue, em http://tools.medialab.sciences-po.fr/iwanthue/ , com muitas informações nas outras guias.
Referências
Lin, Sharon, Julie Fortuna, Chinmay Kulkarni, Maureen Stone e Jeffrey Heer. (2013). Selecionando cores de ressonância semântica para visualização de dados. Fórum de computação gráfica (Proc. EuroVis), 2013
fonte
Paul Tol fornece um esquema de cores otimizado para diferenças de cores (ou seja, dados categóricos ou qualitativos) e visão daltônica em seu site , e em detalhes em uma "nota técnica" (arquivo PDF) vinculada a ele. Ele afirma:
Peguei o esquema de cores da "Paleta 1" das 9 cores mais distintas e coloquei em meu
matplotlibrc
arquivo emaxes.color_cycle
:Em seguida, tomando emprestado da resposta de Joe Kington, as linhas padrão, conforme plotadas por:
resulta em:
Para mapas de cores divergentes (por exemplo, para representar valores escalares), a melhor referência que eu vi é o artigo de Kenneth Moreland disponível aqui " Mapas de cores divergentes para visualização científica ". Ele desenvolveu o esquema frio-quente para substituir o esquema arco-íris e "apresenta um algoritmo que permite aos usuários gerar facilmente seus próprios mapas de cores personalizados".
Outra fonte útil de informações sobre o uso da cor em visualizações científicas vem de Robert Simmon, o homem que criou a imagem "Blue Marble" para a NASA. Veja sua série de postagens no site do Observatório da Terra.
fonte
No colorbrewer2.org, você encontra esquemas de cores qualitativos , seqüenciais e divergentes . Qualitativa maximiza a diferença entre cores sucessivas, e é isso que estou usando no gnuplot. A beleza do site é que você pode copiar facilmente os códigos hexadecimais das cores, para facilitar a importação. Como exemplo, estou usando o seguinte conjunto de 8 cores:
É bastante agradável e produz resultados claros.
Como observação lateral, sequencial é usado quando você precisa de um gradiente suave e divergente quando precisa destacar diferenças de um valor central (por exemplo, elevação da montanha e profundidade do mar). Você pode ler mais sobre esses esquemas de cores aqui .
fonte
Existem muitos sites dedicados à escolha de paletas de cores. Não sei se existe um conjunto específico de cores que é objetivamente o melhor; você terá que escolher com base no seu público e no tom do seu trabalho.
Confira http://www.colourlovers.com/palettes ou http://design-seeds.com/index.php/search para começar. Alguns deles têm duas cores próximas para mostrar grupos diferentes, mas outros oferecem cores complementares em uma faixa mais ampla.
Você também pode verificar os conjuntos de cores predefinidos não padrão no Matplotlib .
fonte
Eu gosto da paleta Dark2 do colorbrewer para gráficos de dispersão. Usamos isso no livro ggobi , www.ggobi.org/book . Mas, caso contrário, as paletas de cores são destinadas a áreas geográficas e não a plotagens de dados. A boa escolha de cores ainda é um problema para plotagens baseadas em pontos.
Os pacotes R
colorspace
edichromat
são úteis.colorspace
permite a seleção de cores ao redor do volante: você pode passar horas / dias em sintonia fina.dichromat
ajuda a verificar daltonismo.ggplot2
geralmente possui bons padrões, embora não seja necessariamente uma prova daltônica.O esquema divergente de vermelho para azul fica bem no seu computador, mas não se projeta bem.
fonte
Outra possibilidade seria encontrar um conjunto de cores que sejam a) equidistantes no LAB, b) levem em consideração o daltonismo ec) podem caber na gama do espaço de cores sRGB, bem como nas gamas dos espaços CMYK mais comuns.
Acho que o último requisito é uma necessidade para qualquer método de escolha de cores - não adianta se as cores ficam bem na tela, mas ficam confusas quando impressas em um processo CMYK. E como o OP especificou "qualidade da publicação", estou assumindo que os gráficos serão realmente impressos em CMYK.
fonte
Este é o meu esquema favorito. Possui 20 (!!!!) cores distintas, todas facilmente distinguíveis. Provavelmente, porém, falha em pessoas daltônicas.
fonte
Ao plotar linhas, você deve observar o verde e o amarelo, que não aparecem bem nos projetores. Como, eventualmente, reutilizo a maioria dos meus gráficos em apresentações, evito essas cores, mesmo que a intenção original seja a publicação em tela ou papel.
No interesse de manter um alto contraste, isso me deixa com preto, vermelho, azul, magenta, ciano e, se eu realmente preciso, uso cinza. De fato, a maioria delas são cores vivas, primárias ou secundárias. Sei que pode não ser ideal do ponto de vista estético, mas estou mais interessado na clareza do que estou apresentando. Por outro lado, reutilizar consistentemente as mesmas cores de uma paleta limitada pode ser uma boa coisa esteticamente.
Se você estiver usando mais de 6 linhas, estará preenchendo mais espaço e avançando na plotagem de blocos de cores. Para esses tipos de enredo, acho que cada caso precisa ser considerado separadamente. Deseja que os extremos se destaquem ou os cruzamentos de zero? Seus dados são cíclicos (por exemplo, 0 e 2π devem usar a mesma cor)? Existe uma analogia com padrões como azul / vermelho para temperatura? O branco representa NaN, nenhum dado ou será usado como destaque? etc etc.
fonte
Para os visualizadores daltônicos, o CARTOColors possui um esquema qualitativo e amigável para daltônicos, chamado
Safe
baseado nos esquemas de cores populares de Paul Tol . Esta paleta consiste em 12 cores facilmente distinguíveis.Outra ótima paleta qualitativa para daltônicos é o esquema de Okabe e Ito proposto em seu artigo "Design universal de cores (CUD): como fazer figuras e apresentações que são amigáveis para as pessoas daltônicas".
fonte