Qual é o nome desse gráfico usando linhas verticais para mostrar uma distribuição?

14

Existe um nome oficial para esse gráfico extremamente simples, no qual linhas verticais indicam a distribuição de algumas amostras em um intervalo?

insira a descrição da imagem aqui

janeiro
fonte
8
"tapete", quando usado com outras parcelas.
Gimelist
7
Não existe um nome oficial. Depende muito se o uso de linhas verticais é essencial ou se outros símbolos serão aceitos e se o empilhamento ou tremulação é permitido quando há empates. Em stats.stackexchange.com/questions/102735/… , dou 22 nomes diferentes encontrados para o sentido mais amplo desse tipo de enredo.
Nick Cox

Respostas:

24

O primeiro exemplo em que os vi referenciado são as Tiras exibindo distribuições empíricas: I. tiras de pontos texturizados (Tukey e Tukey, 1990), embora eu nunca tenha sido capaz de realmente obter esse relatório técnico.

Tim está certo: eles geralmente são acompanhados como o tapete em um gráfico adicional para mostrar a localização de observações individuais, mas o gráfico do tapete é um pouco mais geral e esse tipo de gráfico nem sempre está no tapete de outro gráfico, como mostra sua pergunta!

  • Aqui está um exemplo do uso de pontos no tapete em vez de linhas.
  • Aqui está um exemplo do tapete sendo pontos e não exibindo todos os dados, mas apenas dados ausentes na outra dimensão de um gráfico de dispersão.

Portanto, um gráfico de tapete nem sempre é um conjunto de linhas nas bordas de outro gráfico, e esse tipo de gráfico na sua pergunta nem sempre está nas margens de outro gráfico. Aqui está um exemplo das linhas sobrepostas em uma densidade de kernel em vez de no tapete da plotagem, chamada de beanplot . As linhas maiores, acredito, são usadas para visualizar diferentes quantis (também conhecidos como valores das letras) da distribuição.


(fonte: biomedcentral.com )

Na Gramática de gráficos de Wilkinson , pode ser considerado um gráfico de dispersão unidimensional, mas usando segmentos de linha em vez do padrão típico de círculos. O objetivo disso é impedir que muitos dos pontos próximos sejam sobrepostos. Se você tiver muitos pontos e desenhá-los semitransparentemente, eles eventualmente se transformarão em uma faixa de densidade, veja a figura final neste post .

Eu até os vi sugeridos para usar como linhas de explosão ( Greenhill et al., 2011 ) nesse exemplo para visualizar dados binários. Greenhill os chama nesse exemplo de parcelas de separação , e aqui está um exemplo retirado do artigo referenciado (p.995):

insira a descrição da imagem aqui

Portanto, nesse exemplo, existem valores ao longo de todo o eixo, e a cor é usada para visualizar uma variável binária. A linha preta nesse gráfico é a proporção cumulativa de observações em vermelho.

Andy W
fonte
6
O gráfico de tira +1 também é um termo comum.
whuber
1
@ whuber: plotagem de tira, sim, ou um gráfico de tira .
ameba diz Restabelecer Monica
1/nnn
Essa é uma descrição justa do @NickCox, mas não acho que os lotes de separação sejam tão diferentes. Na gramática de Wilkinson, pode ser considerado um gráfico de dispersão unidimensional, com a classificação na dimensão única e depois usando a cor para distinguir entre os dois tipos de pontos. Com apenas dois tipos de pontos, você nem precisa ter os dados para um dos conjuntos; portanto, o gráfico original do OP pode ser um gráfico de separação, com as barras pretas exibindo uma categoria e o fundo cinza como complemento.
Andy W
Não é tão diferente de algumas linhas que eu já vi visualizando vitórias / derrotas para equipes esportivas. (Todos os gráficos precisam ser mapeados para um intervalo finito para projetar os dados na tela da página / computador, portanto, se os dados reais estão restritos ao intervalo de unidades, não acredito que seja material para descrever o próprio gráfico.) Eu não chamaria um gráfico de dispersão dos dados classificados com um nome diferente porque os pontos não são colocados "onde pertencem".
Andy W
20

É chamado de plotagem de tapete (veja, por exemplo, aqui ou aqui ). Em R, isso pode ser feito com uma rugfunção.

O gráfico parece aparecer também sob outro nome, como gráfico de tiras , é referido por Phillip I. Bom em Introdução à Estatística por Métodos de Reamostragem e R / S-Plus (2005, Wiley). Em R é chamado por stripchartfunção.

Parece que a versão minúscula que geralmente acompanha uma trama maior é chamada de trama de tapete, enquanto a trama autônoma feita de pontos ou linhas verticais é denominada strip chart.

Tim
fonte
Porra, eu estava tão perto - eu estava procurando por um enredo de trapos (e previsivelmente, não vi nada). Obrigado!
janeiro
2
Penso que, na prática, as pessoas se referem apenas a gráficos como gráficos de tapete quando são marginais a algum outro ponto, como um histograma ou gráfico de dispersão.
Nick Cox
3

Na etiquetagem comercial de mercadorias, código de barras ou

se são linhas de frequência plotadas no tempo, Spectrum .

EDIT1

Quando em nuvens eletromagnéticas ou cromatógrafos de gás, as forças são plotadas linearmente em escala de frequência, também podemos dizer Spectrum.

Narasimham
fonte
3
Olá, seja bem-vindo ao site. Infelizmente, isso não responde à pergunta, pois as linhas em códigos de barras ou espectros "não indicam a distribuição de algumas amostras em um intervalo", conforme a pergunta especifica.
Juho Kokkala
4
@JuhoKokkala Eu discordo em parte. Os códigos de barras usados ​​na indústria não coincidem, mas o termo gráfico de códigos de barras foi usado para indicar esse tipo de gráfico para dados reais. Da mesma forma, os dados espectroscópicos certamente também se qualificam como dados. Eu não me ateria ao texto do OP, pois confunde "amostras" e "valores de amostra".
Nick Cox
2
A trama do tapete é a mais próxima, eu concordo. Mas também é chamado de gráfico de código de barras. O gráfico de código de barras, no entanto, geralmente tem espessura de linha, ou sombra / transparência, para mostrar a densidade de valores próximos. Usamos muito esse tipo de gráfico com dados de DNA para marcar os locais dos recursos.
Dianne Cook
0

Eu tenho o mesmo problema: qual é o nome do "código de barras" como visualização para dados verdadeiros / falsos

Meu objetivo é representar uma lista de array verdadeiro / falso correspondente a um array de palavras em um local fixo no array. Como representação do "espectro de luz" para identificar a absorção de uma onda de luz específica .... em uma mesma situação, quero enfatizar as palavras ausentes e as palavras presentes

Eu encontrei no Vega the Strip Plot

https://vega.github.io/vega-lite/examples/tick_strip.html

Eu acho que para meu objetivo é um nome melhor para representar minha ideia de visualização

Domenico M.
fonte