Eu sempre vi conjuntos de dados discretos plotados como gráficos de linhas, mas me ocorre que a linha infere um valor em um ponto entre os intervalos de medição que não faz sentido para conjuntos de dados discretos. É, portanto, o caso de o uso de gráficos de linha para dados discretos estar errado?
Como exemplo, pegue dois conjuntos de dados de séries temporais, um contínuo (meu peso, medido diariamente pela manhã) e um discreto (o número de donuts que eu como por dia). Faz sentido que o primeiro conjunto de dados seja um gráfico de linhas, pois é razoável inferir que meu peso em qualquer tarde será relacionado ao meu peso nas manhãs anteriores e seguintes. No entanto, se o número de rosquinhas for representado como um gráfico de linhas, as linhas entre os pontos não poderão ser inferidas dessa linha.
EDITAR
Aqui está outro exemplo: a parcela do salário mínimo por hora federal desde o início em http://mste.illinois.edu/courses/ci330ms/youtsey/lineinfo.html
A menos que eu esteja enganado, as variações do salário mínimo são discretas e, portanto, não é possível procurar algum tempo selecionado arbitrariamente e estabelecer o salário mínimo no ponto usando a linha que interliga os pontos.
fonte
Respostas:
As plotagens de linhas conectadas se mostraram úteis demais para limitar a uma única interpretação. Alguns usos proeminentes:
fonte
Bem, os donuts podem estar relacionados ao peso :-)
Enquanto eu entendo o seu argumento, acho que este exemplo não é tão ruim porque o tempo (no eixo horizontal, ao que as linhas se referem) é contínuo. O significado da linha, para mim, não é tanto que, a cada hora do dia, você come um certo número de rosquinhas, mas o número de rosquinhas por dia muda de alguma maneira regular. Assim, podemos adicionar algo como um pouco mais suave à linha, e isso faria sentido. É pelo menos razoável pensar em rosquinhas comidas a cada hora ou até a cada minuto (embora isso fosse mais sensato com uma variável em que a contagem por dia era maior)
O que é mais preocupante é quando o eixo horizontal é discreto (e especialmente quando é nominal), mas as linhas são desenhadas. Isso realmente não faz sentido. Por exemplo, se você está olhando (digamos) a% de votos para Obama entre (digamos) residentes de diferentes regiões dos EUA, não faz sentido traçar uma linha entre o Nordeste e o Centro-Oeste; especialmente porque a ordem das regiões é arbitrária, mas alterar a ordem alteraria as linhas. No entanto, vi gráficos como este.
fonte