Proporção de tinta para dados e planos de fundo de plotagem

17

Percebi que muitos pacotes e temas de plotagem "de última geração" e muitas pessoas distintas de dados usam fundo cinza para suas plotagens. Aqui estão vários exemplos:

ggplot2:

insira a descrição da imagem aqui

Nate Silver's fivethirtyeight.com:

insira a descrição da imagem aqui

Enquanto no primeiro exemplo acima (ggplot2), pode-se argumentar que o uso de fundo cinza reduz a tinta necessária para linhas de grade, esse certamente não é o caso do segundo caso. Quais são as vantagens de usar o plano de fundo cinza, em vez do branco ou transparente?

David D
fonte
2
Uma trama é um prato servido - fundo cinza é um prato.
ttnphns
3
@ttnphns Gosto da analogia. Hadley Wickham disse sobre o plano de fundo do ggplot: "O plano de fundo cinza confere à plotagem uma cor semelhante (em sentido tipográfico) ao restante do texto, garantindo que os gráficos se ajustem ao fluxo de um texto sem saltar com um fundo branco brilhante. Por fim, o plano de fundo cinza cria um campo contínuo de cores que garante que o gráfico seja percebido como uma única entidade visual. " Ele também justificou as linhas de grade com base no fato de que elas podem ser facilmente "desligadas".
Silverfish
1
Também gosto muito da sua analogia. @ silverfish sim, exatamente certo, com a escala de cinza combinando com os olhos e comparar o quadrado da plotagem com o texto na página. Hadley tornou popular o fundo cinza. Seu design com o plano de fundo cinza da plotagem, mas com suporte branco (eixos) deixa claro onde os dados começam e terminam. E os dados são exibidos com mais visibilidade do que a grade de segundo plano, que segue bons princípios cognitivos. A grade fica para trás até que você precise usá-la para procurar valores.
Dianne Cozinhe
3
@ Silverfish Veja primeiro Jacques Bertin ( Semiologia gráfica ), Alan MacEachran ( Como funcionam os mapas ) e Lee Wilkinson ( A gramática dos gráficos ). MacEachran fornece todos os detalhes fisiológicos, psicológicos e culturais com muitas referências. Não se deixe levar pela referência a "mapas": seu livro se preocupa principalmente com como as pessoas interagem e criam significado a partir de gráficos informativos em geral, dos quais mapas são apenas um exemplo destacado.
whuber
2
@silverfish É possível que o trabalho de Dan Carr, que começou a usar o fundo cinza e linhas de grade brancas com as tabelas de parcelas trabalhar no início dos anos 90 dev.bowdenweb.com/maps/m/using-gray-in-plots.pdf é a fonte da ideia. Conheço Hadley e discuti isso. Mas a analogia com a escala de cinza squint do texto é a explicação de Hadley.
Dianne Cozinhe

Respostas:

18

A proporção de dados e tinta

Esse conceito se deve ao influente Edward Tufte , da Universidade de Yale, que o descreveu em A exibição visual de informações quantitativas .

Ele distingue "tinta de dados" (que inclui pontos, barras etc., mas também etiquetas textuais ou gráficas) de tinta apagável (incluindo linhas de grade, eixos, bordas e também informações redundantes). A proporção entre dados e tinta é simplesmente a proporção da tinta usada que não pode ser apagada.

Há uma discussão sobre como esses princípios de tinta de dados podem se aplicar às visualizações de computador no site de troca de pilhas UX .

Por que alguns especialistas preferem um fundo cinza?

Hadley Wickham justificou sua escolha de fundo padrão, em seu livro sobre ggplot2:

O plano de fundo cinza dá ao plot uma cor semelhante (em sentido tipográfico) ao restante do texto, garantindo que os gráficos se ajustem ao fluxo de um texto sem saltar com um fundo branco brilhante. Finalmente, o plano de fundo cinza cria um campo contínuo de cores que garante que o gráfico seja percebido como uma única entidade visual.

O princípio parece ser impedir que "salte" para o espectador em uma página impressa e fornecer unidade visual. Pessoalmente, eu também gosto do brilho reduzido da tela.

Ele também justificou as linhas de grade brancas com base no fato de que elas podem ser facilmente "desligadas". Concordo com Dianne Cook nos comentários de que isso permite que os dados se destacem acima das linhas de grade, reduzindo a desordem visual. As linhas de grade brancas são uma vantagem de um fundo um pouco mais escuro - curiosamente, o Tufte geralmente evita linhas de grade onde não são necessárias (elas não contam como "tinta de dados"), mas em alguns gráficos de barras cinza se sobrepõe às linhas de grade brancas. De certa forma, esse é um efeito semelhante ao ggplot2, mas na verdade coloca as linhas de grade em primeiro plano , dando às barras uma aparência "listrada". Uma desvantagem específica disso é que você não pode ver a próxima linha de grade mais alta acima de uma barra,

Por que alguns especialistas preferem um fundo branco?

Um dos ggplot2segmentos mais visualizados no Stack Overflow é " Como altero a cor do plano de fundo? ", O que sugere que o padrão não é universalmente popular.

A cor de um elemento pode parecer bastante diferente, dependendo da cor de fundo em que é exibido. Tufte na verdade discute isso no capítulo 5 "Cor e informação" em seu livro " Visualizando informações", mas não coloca isso no contexto de, por exemplo, um gráfico de dispersão. Maureen Stone, especialista em cores e professora adjunta da Universidade Simon Fraser, recomenda fortemente um fundo branco por vários motivos, incluindo que a maioria das paletas de cores (em seus exemplos, usadas para indicar a espécie ou divisão) foram projetadas com fundo branco (para impressão) em mente. Suas propriedades perceptivas diferem em um fundo mais escuro. Ela sugere que o branco tem uma vantagem perceptiva, porque nossa percepção de cores é relativa ao branco "local", portanto, ter um fundo branco disponível visualmente pode estabilizar nossa percepção.

Ela também sugere um motivo mais prático com o qual estou familiarizado: o uso de um fundo branco permite otimizar um gráfico para exibição e impressão eletrônica , em vez de precisar preparar uma versão diferente para impressão.

Silverfish
fonte
2
+1 para pintar (por assim dizer) os dois lados da questão. Ouvi o raciocínio de Hadley, mas não ouvi Stone * Fraser. Obrigado!
305 Wayne Wayne
8

Desde que o plano de fundo seja claro o suficiente para proporcionar um bom contraste com as marcas de dados, é principalmente uma questão de estética, seja branco ou cinza claro. Embora a cor do plano de fundo seja "tinta" em algum sentido, não creio que seja considerada "tinta" logicamente. Não há distração proporcional de um campo sólido de cinza claro.

Por outro lado, as linhas de grade contam como "tinta" lógica nos dois casos. Embora as linhas de grade brancas não consumam tinta para impressão, elas ainda dividem o plano de fundo e criam um trabalho extra de processamento visual. Eu diria que as 538 linhas de grade usam menos tinta lógica, porque têm menos contraste.

xan
fonte
"Eu diria que as 538 linhas de grade requerem menos tinta lógica ..." - Eu concordo, acho as linhas de grade padrão do ggplot2 extremamente perturbadoras. No exemplo do ggplot2, no topo da pergunta do OP, meus olhos são atraídos para as linhas de grade e não para os dados.
Adrian