O que é um 'bagplot' ou 'bivariate boxplot'?

11

Eu encontrei um artigo que introduz a versão do boxplot multidimensional (bivariada aqui) - um bagplot. O que é exatamente esse bagplot? Eu posso ver a série de polígonos aninhados com base em vértices, um desses polígonos sendo declarado como um lote de bagagens. Qual é a ideia da construção de polígonos aninhados? Qual dos polígonos é o bagplot (central ou com o número médio de pontos)? As bordas de um lote de bagagem possuem algumas propriedades úteis (como dividir especificamente o conjunto de pontos)?

mbaitoff
fonte
3
Há um artigo de Rousseeuw, Pits e Tukey no American Statistician que explica isso. Por algum motivo, estou tendo problemas para colar o link, mas o Google "bagplot" e "Tukey" o encontrarão
Peter Flom - Restabelecer Monica
1
Só o encontrei por um preço exorbitante. Ainda procurando.
mbaitoff
1
Se você tiver acesso a qualquer biblioteca decente, eles devem ter. O Estatístico Americano é amplamente aceito. Havia também algo no quora, mas eu não olhei para ele.
Peter Flom - Restabelece Monica
2
Rousseeuw e Ruts têm outro artigo on-line, além do Estatístico Americano, no formato postscript gratuitamente.
21712 Andy W no dia
@ AndyW, perguntando a você como um colega do SPSS: como você acha que é possível fazê-lo via GPL de alguma forma? Você vai inventar o código para nós, SPSSers?
ttnphns

Respostas:

13

Aqui está um exemplo com notas:

Aqui está o artigo The Bagplot: A Bivariate Boxplotde Peter J. Rousseeuw, Ida Ruts e John W. Tukey em The American Statistician: http://venus.unive.it/romanaz/ada2/bagplot.pdf

Do resumo desse artigo:

A “mediana da profundidade” é o local mais profundo e é cercada por uma “bolsa” contendo as observações n / 2 com maior profundidade. Aumentar a bolsa por um fator 3 produz a “cerca” (que não é plotada). As observações entre a bolsa e a cerca são marcadas por um laço cinza claro, enquanto as observações fora da cerca são sinalizadas como outliers. O bagplot visualiza a localização, propagação, correlação, assimetria e cauda dos dados.

Aqui está uma ilustração das principais partes:

insira a descrição da imagem aqui

Discussões adicionais podem ser encontradas no seguinte:

Nos documentos de ajuda do aplpackpacote (para Rusuários):

Um bagplot é uma generalização bivariada do boxplot bem conhecido. Foi proposto por Rousseeuw, Ruts e Tukey. No caso bivariado, a caixa do lote muda para um casco convexo, o saco do lote. Na sacola estão 50% de todos os pontos. A cerca separa pontos na cerca dos pontos externos. É calculado aumentando a bolsa. O loop é definido como o polígono convexo que contém todos os pontos dentro da cerca. Se todos os pontos estiverem em uma linha reta, você obtém um gráfico de caixa clássico. bagplot () plotagem de plotagens que são muito semelhantes às descritas em Rousseeuw et al. Observações: A mediana bidimensional é aproximada. Existem dificuldades conhecidas com pequenos conjuntos de dados (mas acho que não é aconselhável fazer um resumo (gráfico) de, por exemplo, 10 pontos).

Caso as pessoas desejem plotar vários lotes de bagagens (overlappIng), é conveniente que os lotes sejam semi-transparentes. Por esse motivo, o sinalizador de transparência foi adicionado ao comando bagplot. Se a transparência == TRUE, a camada alfa é definida como '99' (hex). Isso faz com que os bagplots apareçam semitransparentes, mas SOMENTE se o dispositivo de saída for PDF e aberto usando: pdf (file = "filename.pdf", version = "1.4"). Por esse motivo, o padrão é transparência == FALSE. Esse recurso, bem como os argumentos para especificar cores diferentes, foram propostos por Wouter Meuleman.

E um exemplo:

library(aplpack)
attach(mtcars)
bagplot(wt, mpg, xlab="Car Weight", 
        ylab="Miles Per Gallon",
        main="Bagplot Example", 
        transparency = TRUE, 
        show.whiskers = FALSE, 
        # note that data a 'fence' separates inliers from outliers, 
        # and a 'loop' indicates the points outside the bag but 
        # inside the fence. In the 'bag' are 50 percent of all 
        # points
        show.loophull = TRUE, # draw 'loop'?
        show.baghull = TRUE)  # draw 'bag'?

insira a descrição da imagem aqui

Perguntas relacionadas:

Ben
fonte
4
Atualização: alguém criou um geom ggplot2 para isso: gist.github.com/benmarwick/00772ccea2dd0b0f1745 . talvez um usuário empreendedor possa transformar isso em um pacote?
shadowtalker