Problemas com gráficos de pizza

28

Parece haver uma crescente discussão sobre gráficos de pizza.

Os principais argumentos contra isso parecem ser:

  • A área é percebida com menos energia que comprimento.
  • Os gráficos de pizza têm uma relação ponto-a-pixel muito baixa

No entanto, acho que eles podem ser de alguma forma úteis ao retratar proporções. Concordo em usar uma tabela na maioria dos casos, mas quando você está escrevendo um relatório comercial e acaba de incluir centenas de tabelas, por que não ter um gráfico de pizza?

Estou curioso sobre o que a comunidade pensa sobre esse tópico. Outras referências são bem-vindas.

Eu incluo alguns links:


Para concluir esta questão, decidi construir um exemplo de gráfico de pizza versus gráfico de waffles.

insira a descrição da imagem aqui

deps_stats
fonte
7
Acho que seu gráfico de waffles não está claro, devido ao espaço em branco excessivo.
S11
3
Por que o MAR tem 5 quadrados e 7%, mas OUTROS têm 7 quadrados e 5%?
gerrit 17/09/2015
1
Ambos os links estão agora mortos
tdc 21/03/19
Além disso, acho que as categorias no gráfico de waffles devem ser lidas da esquerda para a direita e, em seguida, de cima para baixo (para que o FAN deva percorrer as 3,5 linhas superiores, em vez das primeiras 3,5 colunas). Lemos da esquerda para a direita e comparar as proporções verticalmente é mais difícil do que precisa.
Twitch_City

Respostas:

24

Eu não diria que há um interesse ou debate crescente sobre o uso de gráficos de pizza. Eles são encontrados em todos os lugares da Web e nas chamadas soluções "analíticas preditivas".

Acho que você conhece o trabalho de Tufte (ele também discutiu o uso de vários gráficos de pizza ), mas o mais engraçado é o fato de o segundo capítulo da Gramática de Gráficos de Wilkinson começar com "Como fazer um gráfico de pizza?". Você provavelmente também está ciente de que o gráfico de pontos de Cleveland , ou mesmo um gráfico de barras , transmitirá informações muito mais precisas. O problema parece realmente resultar da maneira como nosso sistema visual é capaz de lidar com informações espaciais. É até citado no software R; da ajuda on-line para pie,

Cleveland (1985), página 264: “Os dados que podem ser mostrados por gráficos de pizza sempre podem ser mostrados por um gráfico de pontos. Isso significa que julgamentos de posição em uma escala comum podem ser feitos em vez de julgamentos angulares menos precisos. ”Essa afirmação é baseada nas investigações empíricas de Cleveland e McGill, bem como nas investigações de psicólogos perceptivos.

Cleveland, WS (1985) Os elementos dos dados gráficos . Wadsworth: Monterey, CA, EUA.

Existem variações de gráficos de setores circulares (por exemplo, gráficos tipo rosquinha) que levantam os mesmos problemas: Não somos bons em avaliar ângulo e área. Mesmo os usados ​​em "corrgram", como descrito em Friendly, Corrgrams: Monitores exploratórios para matrizes de correlação , American Statistician (2002) 56: 316, são difíceis de ler, IMHO.

Em algum momento, porém, eu me perguntei se elas ainda poderiam ser úteis, por exemplo (1) exibir duas classes é bom, mas aumentar o número de categorias geralmente piora a leitura (especialmente com forte desequilíbrio entre%), (2) julgamentos relativos são melhor que os absolutos, que exibir dois gráficos de pizza lado a lado deve favorecer uma melhor apreciação dos resultados do que uma estimativa simples, digamos, um gráfico de pizza misturando todos os resultados (por exemplo, uma tabela de classificação cruzada bidirecional). Aliás, fiz uma pergunta semelhante a Hadley Wickham, que gentilmente me indicou os seguintes artigos:

  1. Spence, I. (2005). Nenhuma torta humilde: as origens e o uso de um gráfico estatístico . Jornal de Estatísticas Educacionais e Comportamentais , 30 (4), 353-368.
  2. Heer, J. e Bostock, M. (2010). Percepção gráfica de crowdsourcing: usando o Turk mecânico para avaliar o design de visualização . CHI 2010 , 10 a 15 de abril de 2010, Atlanta, Geórgia, EUA.

Em suma, acho que elas são boas para representar de maneira grosseira a distribuição de 2 a 3 classes (eu as uso, de tempos em tempos, para mostrar a distribuição de machos e fêmeas em uma amostra em cima de um histograma de idades), mas eles devem ser acompanhados por frequências relativas ou contagens por serem realmente informativos. Uma tabela ainda faria um trabalho melhor, pois você pode adicionar margens e ir além das classificações bidirecionais.

Por fim, há exibições alternativas que são construídas com base na ideia do gráfico de pizza. Posso pensar no gráfico de torta quadrada ou waffle , descrito por Robert Kosara em Entendendo gráficos de pizza .

chl
fonte
Você conhece algum software que implementa gráficos de waffles?
deps_stats
1
@deps_stats Não. Se você estiver interessado em implementá-lo em R, poderá encontrar algumas idéias no mapa de calor do calendário .
chl 31/03
Agora há github.com/hrbrmstr/waffle .
user5748
26

Meu problema pessoal com gráficos de pizza é que eles podem ser úteis para mostrar diferenças como esta:

insira a descrição da imagem aqui

quantas pessoas o usam para mostrar que: insira a descrição da imagem aqui

usuário88
fonte
16

Os gráficos de pizza, como a torta, podem ser deliciosos, mas não são nutritivos.

Além dos pontos já apontados, um é que girar um gráfico de pizza altera a percepção do tamanho dos ângulos, assim como muda a cor.

Se um gráfico de pizza tiver apenas algumas categorias, faça uma tabela. Se houver muitas categorias, as fatias serão muito finas para serem vistas (muito menos para rotular com precisão).

Eu escrevi sobre isso em meu blog

Peter Flom - Restabelece Monica
fonte
1
(+1) Seu blog contém excelentes exemplos de gráfico de pontos vs gráfico de
setores
1

Eu acho que você respondeu sua própria pergunta para o segundo ponto. Se você deseja adquirir imóveis valiosos, que assim seja! No entanto, a primeira bala é mais importante. Com um gráfico de barras, o observador precisa estimar a proporção relativa com base em apenas 1 eixo. Com um gráfico de pizza julgando ao longo de pelo menos 2 eixos, estão envolvidos. E um eixo é curvado. Eu acho que os gráficos de pizza são usados ​​com mais eficiência quando você tem muitas categorias na torta, com uma legenda, e não é tão importante julgar a proporção.

Ralph Winters
fonte
Mas não é mais natural usar um gráfico de pizza para representar a participação de mercado em vez de um gráfico de barras? Apesar área é percebido com menos poder ...
deps_stats
2
@deps Você está certo, mas parece provável que as pessoas estejam comparando ângulos, não áreas, em gráficos circulares e quase circulares, portanto a situação não é tão ruim quanto a percepção da área. Verificou-se que gráficos em forma de torta e "spinners" são boas maneiras de ajudar as pessoas a pensar corretamente sobre probabilidades e proporções também, portanto, há algum mérito possível no uso de gráficos de torta. (Veja Tomada de decisão de uma perspectiva cognitiva (Busemeyer et al), p. 307)
whuber
@whuber (+1) É bom que você tenha mencionado a distinção entre ângulo e área (não notei seu comentário enquanto escrevia minha resposta).
chl 30/03
1
@deps_stats - Sim, normalmente é usado para participação de mercado. Mas, com base no que você já sabe, não acha mais fácil manipular a exibição de acordo com o seu gosto com um gráfico de pizza?
Ralph Winters
Acho que meu problema estava mais relacionado ao "bom gosto" ou ao "design da página", ou seja, como criar um relatório visualmente atraente sem sacrificar a clareza? Preciso adicionar muitas tabelas e gráficos a um cliente e enfrento a decisão de usar gráficos para isso e tabelas para isso, muitas tabelas ou gráficos demais. O que eu realmente preciso é de um equilíbrio entre apelo visual e boa representação de dados. Os gráficos de waffle parecem uma alternativa muito interessante aos gráficos de pizza!
deps_stats
1

Não consigo pensar em quase nenhum caso em que um gráfico de pizza seja melhor que um gráfico de barras ou uma barra empilhada, se você deseja transmitir informações.

Eu tenho uma teoria ou duas sobre como os gráficos de pizza se tornaram tão populares. Meu primeiro pensamento está relacionado aos comerciais de PC. Os primeiros PCs tinham telas de texto (24 x 80 caracteres), geralmente verdes como CRTs de mainframe antigos. Para exibir as novas telas gráficas que tinham uma base de pixels Vermelho-Verde-Azul, um gráfico de pizza era o ideal. Uma tela de texto pode fazer um gráfico de barras de uma maneira, mas não pode fazer um gráfico de pizza remotamente credível. Os gráficos de pizza pareciam muito mais sérios do que mostrar uma tela de Mario Brothers, independentemente de como o PC seria realmente usado. Assim, parecia que todo comercial de PC no final dos anos 80 e no começo dos anos 90 mostrava um gráfico de pizza no monitor.

Uma segunda teoria é que um gráfico de barras ou barra empilhada é melhor se você deseja transmitir informações. Mas e se você não? Então, um gráfico de pizza funciona - e gráficos com efeitos 3D funcionam ainda melhor.

zbicyclist
fonte
1

Seu gráfico de waffles precisa dos valores vermelho e azul alterados. Quanto à questão da torta versus waffle, eu me inclino para waffle. Nos gráficos de waffle, você ainda pode obter as informações em tamanhos pequenos, mesmo que os blocos se misturem, a cor ainda representa as regiões.

Grafic_UT
fonte