Quais atributos tornam uma figura de "qualidade profissional"?

35

Ouvi pessoas dizerem que as parcelas produzidas pela ORIGIN tendem a parecer polidas e "profissionais", enquanto as parcelas produzidas pelo Mathematica não. No entanto, a maioria dos programas de criação de plotagem é bastante configurável e é lógico que, com as configurações certas para coisas como localização e rotulagem de marcadores, opções de fonte e cor, alinhamento de marcadores etc., eu devo poder fazer uma figura com o Mathematica / matplotlib / Gnuplot / etc. que parece tão bom quanto os que vêm de ORIGIN. Mas o que significa uma figura ser "profissional" nesse contexto?

Em outras palavras, se meu objetivo é criar as figuras mais bonitas possíveis para inclusão em um artigo científico, que escolhas de design são geralmente recomendadas para esse objetivo? Obviamente, é preciso escolher o tipo apropriado de plotagem, por exemplo, gráfico de barras vs. plotagem de dispersão e escala linear versus logarítmica, mas essas são escolhas nas quais sempre pensamos, independentemente do programa de plotagem que estamos usando. Estou mais interessado nas coisas em que normalmente não pensamos, que são normalmente definidas de acordo com os padrões de alguns programas de plotagem, mas que podem ser alteradas para melhorar a aparência da plotagem.

David Z
fonte
2
Isso pode estar fora de tópico aqui ... Estou postando-o para investigar os limites do que são perguntas aceitáveis ​​de visualização de dados (cf meta.scicomp.stackexchange.com/questions/55/… )
David Z
5
Considerando a baixa qualidade de muitas parcelas que as compõem em publicações científicas, pode ser que a definição da comunidade precise de melhorias!
David Ketcheson
2
@DavidZaslavsky - Acho que esse pode ser o local mais apropriado para essa questão, pois é específico para a apresentação de dados científicos, que fazem parte da ciência computacional. Muitas vezes tenho visto queixas de cientistas de que os gráficos produzidos pelo nosso software não estão dentro do 'padrão de publicação' e precisam ser corrigidos; portanto, seria bom ver as experiências de outras pessoas com esse problema. Como sempre, com perguntas subjetivas, as respostas devem seguir as seis diretrizes .
Mark Booth
Claro, @ Mark. Eu tentei fazer isso o mais objetivo possível, uma vez que não é uma questão técnica.
David Z
Obrigado David, meu comentário foi mais voltado para as perguntas respondidas, pois estávamos tendendo a respostas curtas na época. As seis diretrizes preferem muito mais que curto, experiência sobre opinião, contexto sobre suposição, imparcialidade sobre preconceito, sério sobre irreverência e sugerem fazer backup de respostas com fatos e referências, etc. Todas essas parecem ser boas coisas para se buscar respostas para esse tipo de questão.
Mark Booth

Respostas:

14

Na IMO, o que torna uma figura "qualidade profissional" é definido pelas regras da revista / editor. O que na verdade se traduz em "qualidade da publicação", que é relativa, dependendo de onde você publica. Algumas regras universais parecem se destacar - invariantes ao software de plotagem que está sendo usado:

1) Uma figura deve conter o menor número possível de elementos necessários para transmitir a informação / ideia / argumento. Uma figura deve ser facilmente lida / compreendida em alguns segundos - se você demorar mais para entender o que está acontecendo na figura, pode haver muita informação. Às vezes, é difícil verificar se você está familiarizado com seu próprio gráfico / dados - não importa o quão sobrecarregado seja - mostrando a alguns colegas para ver se eles conseguem ler com facilidade. (para não se confundir com a compreensão do significado físico por trás da figura - isso geralmente leva algum tempo).

2) Se você precisar usar cores, é melhor limitar-se a poucas, de preferência no lado oposto da roda de cores. Por exemplo, azul e vermelho é melhor que azul e verde. Uma figura pode ter muitos tons - mas é melhor ter poucas cores principais. Costumo usar azul (valores baixos) e vermelho (valores altos) com uma transição de branco no meio. Sempre tenha em mente os leitores daltônicos.

3) Marcas de escala, rótulos de contorno etc. tudo deve ser facilmente legível sem uma lupa - portanto, tamanho de fonte semelhante ao texto do corpo do diário. Você pode verificar se tudo está legível imprimindo uma cópia impressa com larguras de figuras de 3 e 6 polegadas (esses são os tamanhos de figuras comuns em revistas científicas).

4) Por fim, verifique se todos os elementos da figura têm seu objetivo. Se houver algo que não esteja transmitindo informações úteis - jogue fora. Isso ajudará a legibilidade da figura.

No momento em que você se sente confortável com a personalização de todos os pequenos elementos que formam uma figura - marcas, rótulos etc., não importa realmente qual ferramenta você usa, desde que seja capaz de produzir um eps limpo.

milancurcic
fonte
Você pode elaborar a justificativa para (1)? Alguns segundos não demoram muito. É por motivos pragmáticos que as pessoas estão realmente ocupadas, de modo que, se levar mais de alguns segundos para entender a figura, elas não se incomodarão?
Faheem Mitha
@FaheemMitha Não, o que eu realmente quis dizer é que você está fazendo um favor aos leitores se você mantiver a figura clara e simples. Não segure alguns segundos como um critério sólido - é assim que eu estou acostumado a avaliar minhas próprias cifras. Há um limite para a quantidade de informações que você pode colocar em uma figura - colocando muito, você pode acabar dificultando o conteúdo para o leitor entender. Seus leitores se incomodarão em ler números muito ocupados se estiverem interessados ​​no seu trabalho - mas um número menos ocupado faz um trabalho melhor de transmitir as informações.
milancurcic
Não sei se faz sentido aceitar uma resposta para uma pergunta tão nebulosa, mas essa resposta parece melhor codificar as idéias vagas que eu tinha em mente quando a perguntei. Então, você recebe a marca de seleção :-) #
David Z
18

Existem alguns elementos que procuro quando considero algo "qualidade de publicação" em meu próprio trabalho ou no que estou considerando quando olho para os outros. Eles são:

  1. Alta resolução e, de preferência, com base em vetor. Este já deve estar bastante óbvio agora, mas você ficaria surpreso.
  2. Falta de desordem. Eu deveria ser capaz de ver o que está acontecendo em sua figura e ver rapidamente. Há poucas coisas que eu odeio mais do que alguém tentando seguir a orientação "Relação alta de tinta: papel" e usá-la para tentar empinar um manuscrito inteiro em uma única figura.
  3. Imprime bem. Este é o mais importante para mim e, quando estou revisando artigos, sempre testei. "As figuras são impressas?" Mais de uma vez, encontrei figuras cujos pontos são completamente ofuscados quando impressos em escala de cinza, o que os torna inúteis para meus propósitos (não leio nas telas).
  4. Evidência de que o criador sabe como usar as configurações gráficas. Não há opções de eixo de bola ímpar, marcas de escala no lugar certo etc.
  5. Combinado com o nº 2, a falta de "floreio" é de natureza totalmente gráfica. Sombras, desnecessário 3D, etc. que realmente não fazem nada além de desperdiçar o tempo dos leitores.

A maioria deles é honestamente específica para criadores, e não para programas. Vi terríveis plotagens feitas em R e excelentes plotagens feitas em Excel.

Fomite
fonte
Gráficos vetoriais são realmente desejáveis. Mas existem programas de desenho amplamente utilizados que não são?
Faheem Mitha
2
Programas de desenho? Não que eu possa pensar. Programas que produzem gráficos - pacotes estatísticos e afins? Muitos deles têm formatos de saída que não são vetores, ou estão disponíveis como padrão.
fomite
14

Se estamos falando de dados, eu iria para as fontes: A exibição visual de informações qualitativas e evidências bonitas de Edward Tufte .

É claro que o Sr. Tufte entra em alguns detalhes, mas o princípio que se destaca para mim não é gastar tinta em molduras e decoração, mas sim fazer com que o máximo possível de sua tinta leve informações.

Alterado por solicitação de Mark:

Alguns pontos importantes da exibição visual de informações qualitativas são

  • mostre os dados de uma maneira que não distorça ou ofusque o que tem a dizer
  • organizar exibições para permitir comparações entre diferentes dados em diferentes níveis
  • integrar os aspectos gráficos às descrições estatísticas e verbais
  • maximizar a proporção de dados em relação à tinta, removendo elementos que não atendem a nenhum propósito (ou que sejam redundantes por outros elementos) e use quais elementos existem para transmitir informações adicionais (eixos que são variantes em um boxplot, por exemplo)
  • pequenos múltiplos podem ser usados ​​para organizar conjuntos de dados de dimensões mais altas para permitir a comparação com essas dimensões adicionais

Beautiful Evidence é um livro mais abrangente em seu escopo. Vou reproduzir apenas os títulos dos capítulos:

  • Imagens mapeadas: imagens como evidência e explicação
  • Sparklines: gráficos intensos, simples e do tamanho de palavras
  • Links e setas causais: ambiguidade em ação
  • Palavras, números, imagens - juntos
  • Os princípios fundamentais do projeto analítico
  • Corrupção nas Apresentações de Evidências: Efeitos Sem Causas, Escolha de Cereja, Excesso de Alcance, Gráfico de Lixo e Raiva de Concluir
  • O estilo cognitivo do PowerPoint: lançando fora as corrupções dentro
  • Pedestais Esculturais: Significado, Prática, Despedestalização
  • Esculturas de paisagens

Uma das observações interessantes em Beautiful Evidence é que geralmente usamos dispositivos de saída de alta densidade (atualmente, uma impressora de 300 DPI é um dispositivo de baixa densidade) para material impresso, mas muitas vezes desenhamos nossos números para impressoras de tela ou linha, o que desperdiça um enorme potencial para transmitir informações.

dmckee
fonte
A página 13 de A exibição visual de informações quantitativas começa com um bom marcador, resumo de "gráficos profissionais" ou como está intitulado "Excelência gráfica".
Brian Diggs
Brian Diggs - Você ou o dmckee podem atualizar esta resposta com um resumo dos pontos principais? Muitos de nós podem estar interessados ​​o suficiente para conhecer o resumo sem estarem interessados ​​o suficiente para realmente sair e comprar os livros.
Mark Booth
@ Mark: Eu vou chegar no dia seguinte, mais ou menos ... minha cópia está no escritório e agora não estou.
precisa
8

As melhores cifras que pude fazer pessoalmente foram com o pacote TeX PGF / TikZ . Se você usa o LaTex, como muitos das ciências exatas, provavelmente já ouviu falar.

Também parece ser o líder em pacotes gráficos LaTex. Uma proporção considerável das perguntas no site do TeX StackExchange é sobre PGF / TikZ. Não sei por que os resultados são tão bons, mas certamente uma vantagem que o PGF / TikZ tem sobre outros pacotes ao usar o LaTeX é que ele simplesmente se integra melhor ao texto. Por um lado, as fontes na figura serão as mesmas do texto.

Faheem Mitha
fonte
Claro, na verdade, é a minha maneira favorita de fazer figuras ;-) Mas estou mais interessado em saber por que as plotagens TikZ são consideradas boas.
David Z
11
@DavidZaslavsky: Não sei. Até que é um gênio? :-)
Faheem Mitha 12/12
@DavidZaslavsky: Sério, essa pergunta está relacionada ao tex.sx e provavelmente já foi abordada lá.
Faheem Mitha
11
@EpiGrad: Eu apenas quis dizer que perguntar especificamente sobre o TikZ seria mais útil no tex.sx, se David estivesse tão preocupado. É claro que a questão mais ampla não estaria no tópico tex.sx.
Faheem Mitha
11
O pgfplots é incrível. Por padrão, parece muito com o que você deseja, isto é, rótulos em caixas, nítidos em vetor, consistentes com o texto do corpo, etc. Mas também é fácil de ajustar. Meu truque favorito é retirar os eixos de um gráfico de pseudo-cor do Matlab, cortá-lo e envolvê-lo no TikZ. Dessa forma, você obtém uma imagem rasterizada para a pseudo-cor (este é um dos poucos casos em que um gráfico raster é preferível) e a qualidade do LaTeX para eixos e etiquetas e até a barra de cores. Esta é uma das minhas respostas usando pgfplots
qubyte
6

É quase mais fácil caracterizar o que constitui um gráfico ruim do que o que torna um gráfico bom.

Alguns recursos de gráficos ruins:

  • Fontes e símbolos excessivamente grandes ou pequenos
  • Linhas excessivamente finas ou grossas para curvas e outros recursos gráficos
  • Muitas variáveis ​​diferentes sendo mostradas ou variadas ao mesmo tempo
  • Tendo seleções de eixo inadequadas (log versus linear, intervalo etc.)
  • Mostrando tendências entre pontos de dados com curvas sólidas que indicam progressões ou comportamentos que podem não existir
  • Não dando indicação da magnitude de incertezas ou erros
  • Gráficos com legendas ou etiquetas com pouca legenda (incluindo unidades!)

No entanto, em geral, embora a maioria dos pacotes de software seja capaz de criar bons gráficos, quase nenhum programa em que trabalhei com padrões para um estado que produz bons gráficos. Eles sempre exigem ajustes: tamanhos de fonte ou intervalos de exibição, eixos ou opções de símbolos e assim por diante. Atualmente, eu prefiro usar o matplotlib; outras pessoas do meu grupo migraram para o SciDavis.

aeismail
fonte
Não sabe ao certo o que você quer dizer com "Não dando indicação de erros". você pode esclarecer? Caso contrário, boa lista.
Faheem Mitha
Editado para maior clareza: "Não dando indicação da magnitude de incertezas ou erros". No entanto, quando os erros são muito pequenos para serem mostrados, isso pode ser indicado na legenda.
aeismail
5

Eu tive um sucesso razoável usando o pacote Mathematica LevelScheme . Seu modelo de execução difere um pouco da programação tradicional do Mathematica, portanto, há uma curva de aprendizado associada ao seu uso. Porém, é capaz de fornecer um controle fino para gerar gráficos, o que é difícil no Mathematica. Além disso, como um pacote lateral, há um pacote para gerar marcas de escala personalizadas.

(Quando a versão com suporte ao Mathematica v.8 for lançada, ela será renomeada como SciDraw.)

rcollyer
fonte