Estou fazendo uma visualização de dados. Cada dado é representado por um quadrado. Para tornar os dados subjacentes intuitivamente legíveis, o comprimento do lado de cada quadrado ou a área de cada quadrado devem ser proporcionais ao dado que ele representa?
16
Respostas:
Se você, o criador, não tiver certeza, como o leitor saberá qual é?
Resposta curta: o valor deve estar vinculado 1: 1 à quantidade de cores na página . Portanto, no seu exemplo, deve ser área. Mas há mais do que isso: você também precisa evitar sugestões enganosas que possam fazer com que o leitor a leia incorretamente, e precisa saber por que está usando área em vez de comprimento (por exemplo, gráficos de barras), porque possui prós e contras reais.
Primeiro, nunca altere o comprimento e a largura (ou seja, a área) de uma forma quando, na verdade, a variável está vinculada apenas ao comprimento de um lado. Se X for Y duplo, mas Y tiver quatro vezes mais cores na página, você estará enganando seus leitores. Esse tipo de distorção é algumas vezes chamado de " fator de mentira " e é frequentemente considerado uma tentativa deliberada de enganar e exagerar as diferenças.
Se você usar a área como uma medida, eu recomendo fortemente:
Saber por que você está usando a área . Ao usar a área em vez de uma dimensão linear como o comprimento, você:
Considere usar círculos para a área, não quadrados, alinhados ao centro :
Por exemplo, acima, é difícil não ver o quadrado rotulado "5" como sendo três quartos da altura do quadrado rotulado "10", portanto é potencialmente enganador.
Os círculos não convidam esse tipo de comparação: é mais um instante no nível do intestino: "Esse blob é bem maior do que o próximo blob".
Existe uma variedade de evidências, desde testes de usuários a estudos de pequena escala (que tentarão caçar alguns exemplos posteriormente) de que esse tipo de comparação intuitiva baseada em área pode ser mais envolvente, pode reduzir a barreira de entrada para públicos menos engajados e pode ajude a manter o foco do leitor no assunto, e não nas minúcias frias dos números. Mas isso tem o custo de atrapalhar análises mais numericamente pensadas.
Não escolha entre uma dimensão (comprimento ou distância) e duas dimensões (área) por razões estéticas: escolha entre elas com base no seu público e mensagem.
O que é mais apropriado para a comunicação: comparações instantâneas no nível de intestino no nível de "muito maior" ou comparações numéricas mais consideradas no nível de "isso é cerca de 80% do outro"?
Ou existem razões práticas para você usar a área?
Então, quando você escolher por motivos práticos , aplique a estética.
fonte
Eu diria que a área. Opticamente, um quadrado com um lado duas vezes maior mostra uma área 4 vezes maior. Observadores casuais se relacionarão com a área, mesmo sem ler sua lenda.
Um bom exemplo é este gráfico lendário de Randall Munroe da xkcd :
( versão enorme e legível )
fonte
Não somos tão bons em julgar diferenças de área quanto em comprimento. Usamos o comprimento como proxy e, portanto, tendem a subestimar as diferenças de áreas.
Por esse motivo, um círculo que na verdade tem 2x a área de outro parece muito pequeno porque nosso cérebro está relacionando seus raios, que diferem por um fator de 1,4x.
Existem tentativas interessantes de reconciliar esse fenômeno, como o Mapeamento proporcional de símbolos em R , que propõe uma escala perceptiva de símbolos para se alinhar mais de perto com a maneira como julgamos comprimentos e áreas.
Aqui está a Fig. 2 deste artigo
Pessoalmente, não tenho nenhuma experiência com isso e evito usar áreas se forem necessários julgamentos quantitativos.
Uma tangente interessante é a relação entre percepção de volume e comprimento. A diferença em como os percebemos é ainda mais impressionante. Isso pode ser ilustrado neste vídeo de comparações de tamanho de estrela .
Quando você chega à estrela maior, que tem cerca de 1.700x o diâmetro do sol, fica com a impressão de que ela é muito maior que 1.700x.
Para uma visão mais sistemática do nosso erro na percepção de diferenças em áreas e comprimentos, consulte Percepção gráfica de crowdsourcing: uso do turco mecânico para avaliar o design de visualização de Jeffrey Heer e Michael Bostock.
fonte
Na minha opinião, a área (D), não cada lado (E).
Se você estiver usando um lado do comprimento 2, a área seria 4 vezes o valor e você teria um gráfico muito sobreposto. (E)
Quando você tem um gráfico de barras normal (A), os dados são lineares e o da barra é apenas estético. (B)
Nesses casos, a área novamente é representativa dos dados, porque o das barras é o mesmo. Você pode ter uma barra 3D e ainda assim o volume da barra é o que representa os dados (C)
fonte
Tufte lidou com isso extensivamente. Vejo:
Alguns princípios de integridade gráfica:
No seu caso, você deve se perguntar se os dados são melhor representados por uma imagem ou linha 2D ou 3D. Um cubo, um quadrado e uma linha não são os mesmos. Essa é uma das razões pelas quais os gráficos de barras 3D frequentemente enganam.
fonte