Pensando no que significa esse gráfico de análise de plotagem de bean

11

Como interpretar e gerar gráficos de plotagem de bean. Aqui está um exemplo retirado de Walkes et al. 2010 . Para que tipo de dados é mais útil?

lote de feijão
(fonte: biomedcentral.com )

Vanson Samuel
fonte
3
"Um beanplot é uma alternativa ao boxplot para comparação visual de dados univariados entre grupos. Em um beanplot, as observações individuais são mostradas como pequenas linhas em um gráfico de dispersão unidimensional. Depois disso, a densidade estimada das distribuições é visível e a média é mostrada ". Extrato retirado daqui .
Para quem não sabe: esse é um parente próximo da trama de violino (vioplot).

Respostas:

12

Os boxplots foram realmente projetados para dados normais, ou pelo menos dados não -odais. O Beanplot mostra a curva de densidade real, que é mais informativa.

A forma é a densidade e as linhas horizontais curtas representam cada ponto de dados. Isso combina o melhor de um boxplot, plotagem de densidade e plotagem de tapete, tudo em um e é muito legível.

Infelizmente, o exemplo que você escolheu decidiu adicionar várias linhas mais longas que desorganizam o gráfico além do reconhecimento (para mim). [recorte]

EDIT: Depois de trabalhar um pouco mais com o beanplot, as linhas mais grossas são a média (ou opcionalmente a mediana) de cada bean. As linhas finas mais longas são os dados, com uma espécie de "empilhamento", em que linhas mais largas indicam mais valores duplicados. (Você também pode fazer o jitter deles, o que eu prefiro, mas pelo menos a categoria "normal" já tem uma densidade razoável de pontos que o jittering pode piorar.)

Ainda acho que o exemplo que você escolheu é um pouco confuso, que talvez possa ser esclarecido usando tremulação em vez de empilhamento.

O artigo que descreve o pacote R para fazer plotagens de feijão é uma boa leitura.

Wayne
fonte
3
+1 - lendo o artigo da plotagem de bean agora. Eu também sugeriria um documento de trabalho de Hadley Wickham, 40 anos de boxplots . Ele passa por uma descrição de uma variedade de parcelas com mais ou menos os mesmos objetivos que as parcelas de feijão.
Andy W
1

Sem ter lido o artigo inteiro, ele parece ser essencialmente uma variante do boxplot. Dessa forma, você pode usá-lo onde, de outra forma, teria usado um boxplot, como comparar as distribuições univariadas de vários grupos. Ele exibe uma linha para cada ponto e sobrepõe uma estimativa de densidade do kernel. Olhando para ele, eu acho que pode ser mais informativo com pequenas quantidades de dados, mas estar muito cheio de mais dados. Não me parece muito abalador da Terra, à primeira vista. Se você quiser saber algo mais, elabore sua pergunta.

Repor a Monica
fonte