Eu tenho um pequeno conjunto de dados de 14 vezes separadas para concluir uma tarefa. No entanto, estou tendo dificuldade em encontrar um gráfico apropriado para usar no gráfico dos dados. Se a amostra fosse maior, eu usaria um gráfico de caixa ou histograma, mas não tenho certeza se seria apropriado usar neste caso quando a amostra é muito pequena.
Atualização: Os horários são 5.2,3.9,5.6,4.2,3,8,4.1,6.0,5.6,4.4,4.5,4.9,4.5,4.9,4.2
Respostas:
Penso que o princípio cardinal aqui é que você pode e deve mostrar todos os valores individuais. Mesmo que o detalhe não seja obviamente interessante ou útil, não há razão para não mostrá-lo ou obrigar o leitor a decodificar (digamos) um histograma no qual as barras possam representar apenas um ou dois valores.
Eu ofereço aqui um pequeno composto. O canto superior esquerdo é um gráfico de pontos ou faixas (pelo menos vinte outros nomes foram usados para a mesma idéia) apresentados horizontalmente e, no canto superior direito, a mesma idéia apresentada verticalmente. Instâncias do mesmo valor são correspondidas pelo empilhamento.
No fundo, há um gráfico de caixa quantil, no sentido de Parzen, em que a escala horizontal tácita é probabilidade cumulativa (posição de plotagem, em um jargão comum) e a caixa mediana e quartis convencional pode ser desenhada de tal forma que (em princípio) metade os valores estão dentro da caixa, como sempre anunciados, e metade dos valores fora. A linha horizontal extra aqui representa a média. Algumas pessoas adicionam meios aos gráficos da caixa como um símbolo extra de ponto ou marcador; Acho que isso pode colidir com a exibição dos próprios dados e prefiro uma linha extra. Se a linha da mediana e a linha da média parecerem coincidir, você precisará pensar no que fazer. Quase sempre a média e a mediana são discernivelmente diferentes.
Pode-se argumentar que é padrão tornar explícitas as unidades de medida no gráfico, mas não vejo o que são.
(Eu deliberadamente coloquei um ponto extra aqui, que é que os gráficos podem ser muito pequenos, mas ainda informativos. Na prática, eu não os tornaria tão pequenos assim.)
EDITAR:
Referências cruzadas adicionadas às plotagens de caixas quantílicas amplamente no sentido de Parzen (outras referências no segundo abaixo; existem outros usos de "plotagens de caixas quantílicas")
Como posso medir a diferença entre dados não paramétricos com muitos zeros?
Como usar boxplots para encontrar o ponto em que os valores têm maior probabilidade de vir de diferentes condições?
Como visualizar o teste t independente de duas amostras?
Como obtenho qual experimento está melhor usando o Teste U de Mann-Whitney?
Shera, DM 1991. Alguns usos de gráficos quantílicos para melhorar a apresentação dos dados. Ciência da Computação e Estatística 23: 50-53.
Militký, J. e M. Meloun. 1993. Algumas ajudas gráficas para análise de dados exploratória univariada. Analytica Chimica Acta 277: 215-221.
Meloun, M. e J. Militký. 1994. Tratamento de dados assistido por computador em quimiometria analítica. I. Análise exploratória de dados univariados. Chemical Papers 48: 151-157.
EDIT 2:
O ponto principal desses tópicos não é apenas responder à pergunta imediata, mas abordar questões muito semelhantes que possam interessar a outros.
Alguns outros desenhos gráficos em outras respostas aqui mostram identificadores, agnosticamente rotulados 1 ... 14 na ausência de outros detalhes. Supondo que esses e outros identificadores fossem úteis na interpretação, um design simples para mostrá-los é um gráfico de pontos (Cleveland). Aqui estão duas dentre várias possibilidades, nas quais a ordem do identificador é respeitada literalmente (esquerda) e na qual os valores são classificados (direita). Há muito espaço para etiquetas mais longas, se necessário.
Uma vantagem desse design em relação aos gráficos de barras é que o eixo de resposta ou resultado pode começar com um valor diferente de zero se isso parecer uma escolha melhor.
Girar os gráficos para que o eixo de resposta seja vertical também pode ser facilmente imaginado.
fonte
@Nick Cox já deu bons exemplos, duas outras opções que utilizo com certa frequência são o gráfico de caixas com pontos sobrepostos ou tremendo levemente,
Com código R
EDIT: Você também pode usar uma trama de violino, se desejar
fonte
Sua pergunta me lembrou a técnica descrita nesta postagem do blog . É sobre a visualização de eventos discretos.
O truque principal é traçar
the time before an event
xthe time after an event
.Isso pode ser por acaso, mas a parte superior da área central não contém dados. Portanto, há alguma estrutura visível.
O
R
código rápido e sujo .fonte
text
aceita argumentos vetoriais -text(x, y, 1:12)
deve funcionar.Outra idéia, já que você está usando o tempo.
Um gráfico de pista de corrida - um gráfico de barras com coordenadas polares - produz o mesmo efeito que um cronômetro:
Idealmente, os rótulos de observação seriam sobrepostos nas barras ou pelo menos na outra extremidade. No momento, o espectador tem o esforço extra de acompanhar qual observação é qual (para cima / para baixo) ao fazer comparações.
fonte