As linhas de grade e os planos de fundo cinza estão em gráfico e devem ser usados ​​apenas com exceção?

26

Parece que a maioria das autoridades concorda que linhas de grade escuras ou proeminentes em parcelas são "trechos do gráfico" por qualquer definição razoável e distraem o espectador da mensagem no corpo principal do gráfico. Portanto, não vou me preocupar em dar referências a esse ponto.

Da mesma forma, todos podemos concordar que haverá momentos em que linhas de grade claras para criar uma referência para os espectadores serão necessárias. Tufte argumentou a necessidade de (e usou) linhas de grade ocasionalmente, como apontado neste artigo . E eu concordo com a abordagem de Hadley Wickham no ggplot2 para tornar essas linhas de grade brancas sobre um fundo cinza claro, quando você precisar usá-las.

No entanto, não tenho certeza se essas linhas de grade e fundo cinza devem ser o padrão , como estão no ggplot2. Por exemplo, parece não haver outra razão para o plano de fundo cinza, além de colocar em relevo as linhas de grade brancas - o que levanta ainda mais a questão de saber se é necessário. Recentemente, comecei a usar o ggplot2 para a maioria das minhas necessidades gráficas e acho que é incrível, mas desafiou minha abordagem "sem caixa, sem fundo, sem linhas de grade" aos gráficos que eu usava antes. Eu costumava pensar que esse gridlines=OFFdeveria ser o meu padrão, a menos que haja uma razão específica para adicioná-los - basicamente a abordagem recomendada neste artigo , por exemplo.

É claro que é simples definir um tema no ggplot2 para evitar as linhas de grade e o sombreamento de fundo (e, de fato, fizemos isso no meu trabalho), mas a abordagem do ggplot2 é tão impressionante e geralmente suas escolhas estéticas padrão são boas que eu imagino se Estou faltando alguma coisa.

Então - eu ficaria grato por qualquer referência a esse ponto. Tenho certeza de que foi bem pensado (por exemplo, por Hadley Wickham ao definir os padrões do ggplot2) e estou muito aberto a ser apontado na direção certa. O melhor que consegui encontrar é um par de links no grupo ggplot2 do google, mas a referência mais útil de Cleveland não está disponível no link fornecido.

Peter Ellis
fonte
7
Pessoalmente, gosto de linhas de grade (fracas) pela razão óbvia - para facilitar a estimativa dos valores associados aos pontos no gráfico.
mark999
7
Da p. 141 do livro de Hadley: "Ainda podemos ver as linhas de grade para auxiliar no julgamento da posição (Cleveland, 1993b), mas elas têm pouco impacto visual e podemos" ajustá-las "com facilidade. O fundo cinza dá ao enredo uma cor semelhante (em sentido tipográfico) para o restante do texto, garantindo que os gráficos se ajustem ao fluxo de um texto sem saltar com um fundo branco brilhante.Finalmente, o plano de fundo cinza cria um campo contínuo de cores que garante que o gráfico é percebido como uma única entidade visual ".
mark999
4
Andrew Gelman fez muitos blogs sobre infográficos, de maneira semelhante. Pessoalmente, acho que os gráficos sem nenhuma linha de referência são tão ruins quanto as grades que causam distração. Mais elegante e legal, mas ainda interferindo no entendimento e na nossa capacidade de detalhar as informações. A idéia não é ser minimalista, como se fôssemos todos designers de móveis escandinavos, mas comunicar claramente, o que deve incluir linhas de referência sutis (mas úteis).
Wayne
3
Percebo que há muita discussão boa aqui, mas tudo nos comentários - pergunto-me até que ponto uma resposta única e autorizada pode ser fornecida - desconfio que essa pergunta seria melhor como CW e, então, poderíamos nos mover (e elaborar ) alguns desses bons comentários em respostas.
gung - Reintegrar Monica
11
Eu adicionei um desenho resposta sobre alguns dos comentários e converteu-o para uma comunidade wiki
Peter Ellis

Respostas:

15

Uma coisa que pode ajudar a levar o debate adiante é reconhecer o que faz as pessoas distinguirem visualmente entre fundo e primeiro plano, tirando lições da cartografia e aplicando-a de maneira mais geral a qualquer gráfico estatístico.

As pessoas podem inicialmente pensar que a cor é uma boa dica para saber se um objeto específico está em primeiro plano ou em segundo plano, mas esse não é o caso. Tomemos, por exemplo, este exemplo abaixo, retirado de um post no blog da ESRI, Make Maps People Want To Look: Cinco princípios principais de design para cartografia de Aileen Buckley.

confusão de primeiro plano

Então, se eu lhe pedisse para dizer qual é a figura (por exemplo, massa terrestre) e qual é o solo (por exemplo, corpo d'água), qual você escolheria? Um fenonenon semelhante também ocorre com a ilusão de ótica do vaso Rubin .

Lembro-me de algumas pesquisas experimentais na leitura de How Maps Work, de Alan MacEachren, que sugerem que, nas figuras acima, as pessoas escolhem as áreas claras e escuras com igual frequência para a figura (aparentemente, a tonalidade e a saturação da cor são usadas para determinar a figura do solo). Portanto, a cor não pode demarcar intrinsecamente se o plano de fundo concorre com o primeiro plano em qualquer gráfico estatístico, mas outras dicas podem ajudar.

As pessoas geralmente associam figuras como objetos fechados (isso é parte do motivo pelo qual o mapa acima é confuso, pois nenhuma massa é incluída). Isso sugere que, em geral (independentemente da cor do plano de fundo), os elementos no gráfico devem ter limites claramente delineados e os elementos no gráfico devem ser mais escuros que o plano de fundo. Provavelmente, isso distorce o plano de fundo da plotagem para branco, mas ter um plano de fundo cinza não é condenador. Outros aspectos podem ser usados ​​para delinear entre primeiro e segundo plano (a postagem no blog da ESRI menciona alguns deles).

Uma é a odiada sombra do Excel para gráficos ( exemplo dado aqui neste boletim por Dan Carr na figura 2). Embora isso deva vir com a ressalva de que as pessoas podem interpretar os atributos numéricos no local da sombra em vez do elemento pretendido.

Outra é usar cores / saturação diferentes para o contorno de um elemento na plotagem versus o preenchimento interno. Os exemplos são dados abaixo, com o círculo mais à esquerda um exemplo de um limite não claramente delineado.

preenchimento vs contorno

Estes também não parecem ser exaustivos. Para gráficos de linhas, freqüentemente parece que linhas mais grossas chegam ao primeiro plano, enquanto linhas mais finas retrocedem ao fundo.

Porém, isso se destina principalmente a ser um ponto de reflexão: seu auto-estudo parece bastante exaustivo (e agradeço por alguns dos recursos que você forneceu!). Acho que não discordo de nenhum dos recursos que você forneceu, mas não sei se entendo o que Hadley está falando com sua motivação para obter um fundo cinza padrão. Mas a preferência estética pessoal por planos de fundo cinzentos pode ser acomodada, garantindo que os elementos da trama cheguem ao primeiro plano (é isso que realmente importa). Essas lições também podem ser aplicadas às linhas de grade e, se as linhas de grade ajudarem e forem discretas (isto é, em segundo plano), elas certamente não serão um lixo gráfico.

Andy W
fonte
5
Não acho que a questão principal seja distinguir entre plano de fundo e primeiro plano - acho que isso é bem direto. O verdadeiro desafio é criar o gráfico de maneira a tornar as comparações mais fáceis e precisas possíveis. Na minha experiência, as linhas de grade facilitam a leitura e a comparação de valores - embora eu não tem alguma experimentação formal para apoiar isso.
27412 hadley
@hadley, entendi que as (principais) queixas sobre planos de fundo cinza (e linhas de grade) eram de que elas eram intrusivas, sugerindo que elas competem pela atenção com os elementos de dados reais no gráfico. Isso para mim sugere confusão em primeiro plano / segundo plano. Minhas suposições podem estar erradas também (talvez sejam razões puramente estéticas que as pessoas as preferem ou não). A distinção entre primeiro plano e plano de fundo pode ser simples, mas não acho que seja do conhecimento geral, por isso espero que meu post seja útil nesse sentido.
Andy W
11

O professor Wickham escreveu no livro ggplot2:

"Ainda podemos ver as linhas de grade para auxiliar no julgamento da posição (Cleveland, 1993b), mas elas têm pouco impacto visual e podemos" ajustá-las "com facilidade. O fundo cinza confere à trama uma cor semelhante (em sentido tipográfico ) para o restante do texto, garantindo que os gráficos se ajustem ao fluxo de um texto sem saltar com um fundo branco brilhante.Finalmente, o fundo cinza cria um campo contínuo de cores que garante que a plotagem seja percebida como um único entidade visual ".

E @Wayne escreveu:

"Pessoalmente, acho que os gráficos sem nenhuma linha de referência são tão ruins quanto as grades que causam distração. Mais estiloso e legal, mas ainda interferindo no entendimento e na nossa capacidade de detalhar as informações. A idéia não é ser minimalista, como se eram todos designers de móveis escandinavos, mas comunicavam claramente, o que deveria incluir linhas de referência sutis (mas úteis) "

e @Peter Flom escreveu:

Eu acho que linhas de grade fracas devem ser o padrão em um gráfico de dispersão; eles ajudam o leitor; da mesma forma, espaços em branco entre palavras e linhas no texto ajudam o leitor. Eu não gosto do fundo cinza, no entanto. Eu acho isso perturbador. Afinal, o texto geralmente contém letras pretas sobre fundo branco.

Peter Ellis
fonte
3

Embora eu evite o fundo cinza padrão, talvez um dos motivos pelo qual Hadley tenha optado pelo cinza seja permitir que o usuário use mais cores claras e saturadas para exibir dados, o que pode não parecer tão eficaz com um fundo branco.

Nova
fonte
Isso foi planejado como uma resposta à pergunta do OP, um comentário solicitando esclarecimentos ao OP ou a um dos respondentes ou uma nova pergunta sua? Por favor, use apenas o campo "Sua resposta" para fornecer respostas para a pergunta original. Você poderá comentar em qualquer lugar quando sua reputação for> 50. Se você tiver uma nova pergunta, clique no cinza ASK QUESTION na parte superior da página e faça a pergunta lá, podemos ajudá-lo adequadamente.
gung - Restabelece Monica
2
Na verdade, acho que isso constitui uma resposta para a pergunta, pelo menos parcialmente: há alguma discussão aqui sobre se o plano de fundo cinza constitui lixo gráfico, e algum raciocínio para sugerir por que não.
quer
0

Pessoalmente, prefiro o theme_bw escuro à luz, ou mesmo theme_minimal, ao tema padrão do ggplot2 - consulte http://docs.ggplot2.org/current/ggtheme.html .

Tema Padrão

Acho o plano de fundo cinza no tema padrão extremamente perturbador - meus olhos são atraídos pelos blocos cinzentos e não pelos pontos. Isso acontece com alguém mais? Por exemplo, na trama de brinquedos acima, meu olho costuma ser atraído para o canto inferior direito (onde não há pontos de dados).

(Não seria interessante ver gravações de pessoas que olham para essas parcelas?)

Pessoalmente, eu prefiro isso:

tema escuro-sobre-luz

... mas é muito subjetivo - não acho que deva haver uma única regra que todos devem seguir.

Código para esses gráficos:

library(ggplot2)

n <- 100
df <- data.frame(x=runif(n, max=10), epsilon=rnorm(n))
df$y <- 2 + df$x - 0.05*df$x^2 + df$epsilon

p1 <- (ggplot(df, aes(x=x, y=y)) +
       geom_point(size=3) +
       ggtitle("Default Theme"))
ggsave("default_theme_example.png", p1, width=10, height=8)

p2 <- (ggplot(df, aes(x=x, y=y)) +
       geom_point(size=3) +
       theme_bw() +
       theme(panel.border=element_blank()) +
       ggtitle("Custom Theme"))
ggsave("custom_theme_example.png", p2, width=10, height=8)
Adrian
fonte