Formatação de gráficos: quando é apropriado usar um preenchimento em um gráfico de linhas?

12

Essa é uma pergunta de visualização de dados - espero que seja bom fazer isso aqui.

Quando é apropriado usar um preenchimento sob um gráfico de linhas para uma série temporal, como o gráfico abaixo? (que mostra os tempos de ping ao longo de um dia)

Gráfico de linhas com preenchimento embaixo

Eu acho que é mais comum usar uma linha simples, sem preenchimento abaixo, mas é aceitável usar um preenchimento para a variedade visual?

Eu estaria particularmente interessado em saber sobre qualquer pesquisa perceptiva sobre o assunto ou qualquer guia de estilo.

Richard
fonte
1
Se 0sé o limite inferior natural e você o mostra, por que não?
precisa saber é o seguinte
1
Pergunte de outra maneira - por que usar preenchimento se não for necessário? Imagine que você deseja adicionar outra linha de tendência e as coisas ficam desnecessariamente complicadas. Eu também separaria unidade (s) do eixo y e escala.
martin

Respostas:

11

Existe um pouco de arte em equilibrar aspectos estéticos e informativos de um gráfico. Autores / consultores de visualização de destaque como Edward Tufte e Stephen Few escolhem uma estética mínima que evita distrações das partes informativas do gráfico. No entanto, para algumas audiências, uma pequena quantidade de sucesso é justificada - veja a aplicação jornalística de visualização de dados de Alberto Cairo, por exemplo.

O ângulo perceptivo da pesquisa é que todo elemento gráfico comunica uma mensagem, alguns dos quais não temos consciência, porque nosso córtex visual lida com ele (" processamento pré-atento "). Elementos extras, mesmo os redundantes, podem resultar em processamento extra. O gráfico apropriado depende da mensagem a ser comunicada e do público.

Para sua pergunta específica, uma linha conectada enfatiza uma tendência (e variação de uma tendência). A área preenchida enfatiza o desvio da linha de base. Um gráfico de barras ou gráfico de agulhas enfatizaria eventos discretos que se desviavam da linha de base.

O contexto do gráfico também é importante. Se você tiver uma grade de gráficos compactados, o preenchimento ajudará a associar cada linha à sua linha de base.

Finalmente, outra consideração para adicionar elementos gráficos / flores redundantes é que torna mais difícil estender o gráfico com elementos mais informativos. Por exemplo, convém destacar valores especiais, sobrepor outras linhas de tendência ou faixas de sobreposição, como no modelo a seguir.

insira a descrição da imagem aqui

xan
fonte
1
Eu concordo com isto. A menos que o gráfico precise ser colorido porque é a capa de uma revista / livro (e o pessoal de marketing o quer colorido), a cor deve ser usada para informar. Se o gráfico parecer "chato", o culpado é o fato de as informações subjacentes não serem muito interessantes ou muito interessantes no formato de gráfico de linhas. Nesses casos, talvez seja mais útil em um gráfico de pizza, gráfico de radar ou algo mais.
rocinante
1
Sugiro não usar um gráfico de pizza. É mais difícil perceber diferenças no comprimento do arco e na área da cunha do que nas diferenças de altura. Se você não acredita em mim, compare um gráfico de pizza nas proporções 32:34:33 com o mesmo gráfico de barras. Qual é mais fácil de ler?
shadowtalker
2
Eu estava falando em termos gerais, não especificamente para o gráfico acima. Cada tipo de gráfico tem seus méritos. Um determinado tipo de gráfico não é apropriado em todas as situações.
rocinante
4

Mais alguns pontos a considerar:

Conforme mencionado em um comentário, um preenchimento insuficiente é amplamente inadequado se o eixo x não estiver em um ponto y natural de zero. Isso pode ocorrer porque o eixo y está dimensionado para iniciar em um número diferente de zero ou porque as unidades usadas não têm uma interpretação zero natural (por exemplo, Kelvin tem um zero natural, enquanto Celsius não).

Em segundo lugar, um caso em que um preenchimento insuficiente é particularmente válido é se os dados em si podem ser considerados insuficientemente preenchidos. Por exemplo, um gráfico de linhas da altura de uma montanha faz sentido ser insuficiente, a cor do preenchimento representa a terra, enquanto o não preenchido representa o ar.

Um exemplo relacionado pode ser dados de contagem. Se empilhássemos todos os indivíduos em cada ponto x, obteríamos um gráfico de barras. Se a interpolação entre as barras fizer sentido, terminaremos com um gráfico de linhas com um preenchimento insuficiente.

Essa imagem da 'exibição visual de informações quantitativas' pode explicar um pouco melhor. Mostra quais unidades militares estavam na Europa durante a segunda guerra (eu acho). Empilhar as unidades em cada ponto do tempo fornece um gráfico de barras com preenchimento insuficiente. Desenhar uma linha por cima dos dados fornece um gráfico de linhas com preenchimento insuficiente.

timcdlucas
fonte
2
... as unidades militares dos EUA estavam na Europa durante a Primeira Guerra Mundial (as datas de 1917 e 1918 contam a história).
Nick Cox
@nickCox Claro. Não faço ideia por que não vi isso.
timcdlucas
4

As duas respostas anteriores cobrem os principais pontos importantes, mas há algumas coisas que ainda devem ser mencionadas.

Primeiro, devo dizer que discordo da abordagem minimalista extrema da representação gráfica - que toda tinta redundante deve desaparecer. Distração, variação não significativa deve ir. Mas uma área sólida versus uma única linha pode chamar a atenção e comunicar-se mais rapidamente. E como você diz, pode adicionar "variedade visual".

No entanto, como @xan aponta, esse olhar rápido também interpreta uma área de maneira diferente de uma linha, de maneiras parcialmente subconscientes.

Um gráfico de área implica uma quantidade total acumulada à medida que você avança no eixo x. Se você comparar dois gráficos e um tiver uma área maior preenchida, seu olhar dirá que ele possui um total maior, independentemente dos valores inicial e final.

Por outro lado, um gráfico de linhas mostra um valor variável. O foco está na mudança de posição de um ponto para o próximo, não no total acumulado.

Então, quando você deve usar um gráfico de área?

  • quando os valores representam uma quantidade clara com um ponto zero definido mostrado no gráfico;
  • quando o valor representa uma quantia adicionada (ou removida) em cada ponto, como precipitação diária normal ou lucro / perda mensal;
  • quando o valor representa uma distribuição de uma população, o que significa que a área total sob a curva representa o tamanho total da amostra, como a curva em sino do número de alunos com notas diferentes (basicamente um histograma suavizado).

A idéia é que, ao ler o gráfico, se você considerar dois pontos no eixo x, a área mostrada entre eles deve representar uma quantidade real de algo acumulando nesse intervalo. Por esse motivo, se os valores incluírem valores negativos, recomendo o uso de cores opostas para áreas negativas e positivas para enfatizar que eles são cancelados no total.

Quando você não deve usar um gráfico de área?

  • quando o ponto zero é arbitrário (como em temperatura não absoluta, como disse @timcdlucas), inválido (como em medições que são uma razão de dois valores, como uma taxa de câmbio) ou não é mostrado no gráfico por razões de espaço;
  • quando os valores mostrados pela altura da linha já representam uma medida cumulativa, como a precipitação total até a data (para o mês / ano) ou dívida / poupança;
  • quando os valores representam a posição / valor de uma única entidade que muda em vez de uma acumulação;
  • quando você deseja comparar várias linhas no mesmo gráfico (se não conseguir ver a área inteira, perde o significado - compare os gráficos de área lado a lado).

Com essas diretrizes em mente, seu gráfico de ping pode ser interpretado de duas maneiras.

Por um lado, se você pensa na velocidade do ping como uma variável única que muda ao longo do dia, um gráfico de linhas simples seria o mais apropriado.

Por outro lado, se você estiver comparando os padrões diários de velocidade de ping de duas redes diferentes (ou a mesma rede em diferentes dias / períodos de tempo), talvez você queira enfatizar o total quantidade de tempo necessária para tarefas de rede. Por exemplo, se seu gráfico tiver vários picos, em vez de apenas um, um gráfico de linhas enfatizará a variabilidade na velocidade enquanto um gráfico de área enfatizará o atraso total.

Comparar:
Gráfico de linha Mesmo gráfico com área preenchida
o total acumulado é um pouco maior na primeira metade do gráfico (à esquerda da linha vermelha) do que na segunda, mesmo se os picos atingirem valores máximos mais altos à direita. O preenchimento enfatiza esse bloco sólido à esquerda, para que ele se equilibre melhor contra os picos.

(Perdoe a baixa qualidade da imagem - não conseguia descobrir como fazer o R ​​fazer um gráfico de área! Tinha que exportar e editar separadamente.)

AmeliaBR
fonte