Essa é uma pergunta de visualização de dados - espero que seja bom fazer isso aqui.
Quando é apropriado usar um preenchimento sob um gráfico de linhas para uma série temporal, como o gráfico abaixo? (que mostra os tempos de ping ao longo de um dia)
Eu acho que é mais comum usar uma linha simples, sem preenchimento abaixo, mas é aceitável usar um preenchimento para a variedade visual?
Eu estaria particularmente interessado em saber sobre qualquer pesquisa perceptiva sobre o assunto ou qualquer guia de estilo.
data-visualization
Richard
fonte
fonte
0s
é o limite inferior natural e você o mostra, por que não?Respostas:
Existe um pouco de arte em equilibrar aspectos estéticos e informativos de um gráfico. Autores / consultores de visualização de destaque como Edward Tufte e Stephen Few escolhem uma estética mínima que evita distrações das partes informativas do gráfico. No entanto, para algumas audiências, uma pequena quantidade de sucesso é justificada - veja a aplicação jornalística de visualização de dados de Alberto Cairo, por exemplo.
O ângulo perceptivo da pesquisa é que todo elemento gráfico comunica uma mensagem, alguns dos quais não temos consciência, porque nosso córtex visual lida com ele (" processamento pré-atento "). Elementos extras, mesmo os redundantes, podem resultar em processamento extra. O gráfico apropriado depende da mensagem a ser comunicada e do público.
Para sua pergunta específica, uma linha conectada enfatiza uma tendência (e variação de uma tendência). A área preenchida enfatiza o desvio da linha de base. Um gráfico de barras ou gráfico de agulhas enfatizaria eventos discretos que se desviavam da linha de base.
O contexto do gráfico também é importante. Se você tiver uma grade de gráficos compactados, o preenchimento ajudará a associar cada linha à sua linha de base.
Finalmente, outra consideração para adicionar elementos gráficos / flores redundantes é que torna mais difícil estender o gráfico com elementos mais informativos. Por exemplo, convém destacar valores especiais, sobrepor outras linhas de tendência ou faixas de sobreposição, como no modelo a seguir.
fonte
Mais alguns pontos a considerar:
Conforme mencionado em um comentário, um preenchimento insuficiente é amplamente inadequado se o eixo x não estiver em um ponto y natural de zero. Isso pode ocorrer porque o eixo y está dimensionado para iniciar em um número diferente de zero ou porque as unidades usadas não têm uma interpretação zero natural (por exemplo, Kelvin tem um zero natural, enquanto Celsius não).
Em segundo lugar, um caso em que um preenchimento insuficiente é particularmente válido é se os dados em si podem ser considerados insuficientemente preenchidos. Por exemplo, um gráfico de linhas da altura de uma montanha faz sentido ser insuficiente, a cor do preenchimento representa a terra, enquanto o não preenchido representa o ar.
Um exemplo relacionado pode ser dados de contagem. Se empilhássemos todos os indivíduos em cada ponto x, obteríamos um gráfico de barras. Se a interpolação entre as barras fizer sentido, terminaremos com um gráfico de linhas com um preenchimento insuficiente.
Essa imagem da 'exibição visual de informações quantitativas' pode explicar um pouco melhor. Mostra quais unidades militares estavam na Europa durante a segunda guerra (eu acho). Empilhar as unidades em cada ponto do tempo fornece um gráfico de barras com preenchimento insuficiente. Desenhar uma linha por cima dos dados fornece um gráfico de linhas com preenchimento insuficiente.
fonte
As duas respostas anteriores cobrem os principais pontos importantes, mas há algumas coisas que ainda devem ser mencionadas.
Primeiro, devo dizer que discordo da abordagem minimalista extrema da representação gráfica - que toda tinta redundante deve desaparecer. Distração, variação não significativa deve ir. Mas uma área sólida versus uma única linha pode chamar a atenção e comunicar-se mais rapidamente. E como você diz, pode adicionar "variedade visual".
No entanto, como @xan aponta, esse olhar rápido também interpreta uma área de maneira diferente de uma linha, de maneiras parcialmente subconscientes.
Um gráfico de área implica uma quantidade total acumulada à medida que você avança no eixo x. Se você comparar dois gráficos e um tiver uma área maior preenchida, seu olhar dirá que ele possui um total maior, independentemente dos valores inicial e final.
Por outro lado, um gráfico de linhas mostra um valor variável. O foco está na mudança de posição de um ponto para o próximo, não no total acumulado.
Então, quando você deve usar um gráfico de área?
A idéia é que, ao ler o gráfico, se você considerar dois pontos no eixo x, a área mostrada entre eles deve representar uma quantidade real de algo acumulando nesse intervalo. Por esse motivo, se os valores incluírem valores negativos, recomendo o uso de cores opostas para áreas negativas e positivas para enfatizar que eles são cancelados no total.
Quando você não deve usar um gráfico de área?
Com essas diretrizes em mente, seu gráfico de ping pode ser interpretado de duas maneiras.
Por um lado, se você pensa na velocidade do ping como uma variável única que muda ao longo do dia, um gráfico de linhas simples seria o mais apropriado.
Por outro lado, se você estiver comparando os padrões diários de velocidade de ping de duas redes diferentes (ou a mesma rede em diferentes dias / períodos de tempo), talvez você queira enfatizar o total quantidade de tempo necessária para tarefas de rede. Por exemplo, se seu gráfico tiver vários picos, em vez de apenas um, um gráfico de linhas enfatizará a variabilidade na velocidade enquanto um gráfico de área enfatizará o atraso total.
Comparar:
o total acumulado é um pouco maior na primeira metade do gráfico (à esquerda da linha vermelha) do que na segunda, mesmo se os picos atingirem valores máximos mais altos à direita. O preenchimento enfatiza esse bloco sólido à esquerda, para que ele se equilibre melhor contra os picos.
(Perdoe a baixa qualidade da imagem - não conseguia descobrir como fazer o R fazer um gráfico de área! Tinha que exportar e editar separadamente.)
fonte