Fundo:
Anteriormente em Cross Validated, tivemos perguntas sobre:
- Qual é a melhor prática ao preparar gráficos?
- Quais são as boas dicas disponíveis online para plotar duas variáveis numéricas?
Foi sugerido por @david nos comentários a esta pergunta que deveríamos ter uma pergunta do wiki da comunidade com uma regra de visualização por resposta na qual a comunidade pudesse votar.
Questão
Quais são as regras essenciais para projetar e produzir representações gráficas de dados?
Regras
- Uma regra por resposta
- Idealmente, inclua uma breve explicação de por que você acha que é uma boa ideia
- Respostas com exemplos (código e imagem) de boas e más práticas preferidas.
data-visualization
Jeromy Anglim
fonte
fonte
Estar familiarizado com as três dimensões da cor pode ser útil. Se você usar várias cores, elas deverão diferir idealmente em várias dessas dimensões, não em apenas uma.
Valor. O gráfico deve permanecer legível, mesmo em preto e branco. Esta regra simples deve levar em consideração o daltonismo, as impressoras de baixa qualidade e as más condições de iluminação. Mesmo se você usar tons diferentes, verifique se os valores são suficientemente diferentes. Em particular, as plotagens devem estar escuras em um fundo claro (ou o oposto), mas não cinza em um valor cinza. O pior exemplo seria um gráfico azul de fundo vermelho - ambos são valores médios, ou seja, dariam cinzas muito semelhantes após a conversão em preto e branco.
Saturação. A saturação deve ser usada com moderação: uma linha vermelha pura pode ser fina, mas uma linha vermelha mais espessa e menos saturada será mais legível (a espessura aumentada ajuda a distinguir cores e permite reduzir a saturação). Por outro lado, uma área vermelha pura é dolorosa de se olhar: não use cores saturadas para preencher áreas. As paletas de cores do Brewer (projetadas para mapas, não para linhas) fornecem exemplos de opções de cores de baixa saturação. O pior exemplo seria, novamente, um fundo saturado (azul em vermelho ou vermelho em azul).
Matiz. Como mencionado por @gung, evite a combinação de vermelho / verde (semáforo): há muito mais pessoas daltônicas do que você imagina. Especialmente com matiz, menos é mais. Por exemplo, para plotar valores "divergentes" (ou seja, quantidades que podem ser positivas ou negativas), use apenas duas cores (para valores positivos e negativos), para que o leitor possa distinguir imediatamente o que é alto e o que é baixo. Usar um gradiente discreto pode resultar em um gráfico muito mais legível: os limites entre as cores se tornam visíveis e formam um gráfico de contorno.
Você pode ler as Regras práticas de S. Few para o uso de cores em gráficos ou consultar qualquer material sobre "Teoria das cores" para estudantes de arte ou design.
fonte
Coloque o máximo de informações necessárias dentro da própria figura. Não exija que o leitor faça referência à legenda, por exemplo, para identificar o significado de vários símbolos ou cores. Coloque qualquer informação (ou informação suplementar) que não possa entrar na própria figura na legenda. A idéia é minimizar o esforço exigido por um visualizador de gráfico para extrair as informações relevantes - melhor: o gráfico é autoexplicativo, o próximo melhor: as informações suplementares necessárias podem ser rapidamente obtidas da legenda, o pior: o espectador deve ler atentamente as seção de resultados completos, procurando por alguns detalhes cruciais para descobrir o que está acontecendo.
fonte
Faça o enredo o mais simples possível. Nas palavras de Tufte, 'minimize a proporção entre dados e tinta'.
Por exemplo, evite:
fonte
Deixe tempo para editar. Criar um bom gráfico leva tempo e geralmente leva (pelo menos para mim) várias tentativas.
fonte
Não se oponha a vermelho e verde. A cor pode ser útil, mas ao usar cores, lembre-se de que uma minoria substancial de pessoas é daltônica em verde-vermelho. Certa vez, eu estava mostrando alguns dados para alguém, e ele não conseguiu entender o que estava acontecendo nos meus gráficos - era um desperdício e me senti muito estúpido. Outras formas de daltonismo são muito raras, mas verde-vermelho é bastante comum. Esta página possui muitas informações boas. Aqui estão algumas dicas:
fonte
Não use gráficos de barras empilhadas. E em uma nota relacionada, se você tiver um item da escala Likert, não sinta a necessidade de mostrar a proporção de cada resposta a cada item. Esses gráficos fazem meus olhos sangrarem.
Não use gráficos de pizza.
Não duplique dados que estão contidos em um gráfico jogando em uma tabela.
Use uma fonte sans serif como Arial para títulos de gráficos etc., porque esses tipos de fontes foram projetados para serem usados dessa maneira.
Nenhuma postagem sobre design está completa sem uma referência de livro, eu realmente gosto de Regras de Estatística . O Capítulo 9 é o bit relevante para a discussão aqui, e os bits que aponto quando perguntados por que odeio gráficos de barras e gráficos de pizza empilhados. :)
Confissão: em uma das minhas primeiras funções de consultoria estudantil para um pequeno cliente de uma ONG, dei a eles um relatório com muitos gráficos de barras empilhados, impressos em cores (em meados dos anos 90). Eu acho que consegui colocar amarelo, roxo e vermelho nesses filhotes.
fonte
Não mexa com os eixos. Não corte as primeiras cem unidades apenas porque a inclinação do gráfico parece mais impressionante. A imagem ficará grudada e as pessoas lembrarão de um efeito muito maior do que o que foi realmente medido.
fonte