Interpretação de parcelas de violino

9

Estou comparando a distrubuição de diferentes grupos usando as parcelas de violino, no entanto, a maioria dos recursos online que encontrei estão relacionados apenas a como fazer as parcelas e uma interpretação muito básica dos resultados (a variação mediana, os dados são agrupados ou não).

Estou procurando exemplos detalhados que eu possa seguir como minha diretriz para interpretar corretamente as parcelas de violino.

Gago-Silva
fonte

Respostas:

9

Um gráfico de violino é apenas um histograma (ou mais frequentemente uma variante suavizada como a densidade do núcleo) virada de lado e espelhada. Qualquer livro que ensina como interpretar histogramas deve fornecer a intuição que você procura. Editar de acordo com a sugestão de Nick Cox: Freedman, Pisani, Purves, Statistics cobre histogramas.

Quanto a interpretá-las de uma maneira mais formal, o objetivo de representar graficamente a distribuição é ver as coisas pelas quais os testes estatísticos podem ser enganados.

Uma coisa que gosto de fazer com as plotagens de violino é adicionar linhas para a mediana, média, etc. Às vezes, sobrepor um boxplot para que eu possa ver ainda mais na forma de estatísticas resumidas.

No mínimo, você deve conseguir desvios grosseiros nos primeiros momentos (média, dispersão, assimetria, curtose), bem como bimodalidade e discrepâncias.

Ari B. Friedman
fonte
2
+1, um gráfico semelhante é uma pirâmide populacional , a distribuição refletida é apenas uma categoria diferente (e usa estimadores mais típicos do tipo histograma em vez do kde).
Andy W
1
Nem Tukey, análise exploratória de dados , nem Cleveland, elementos de representação gráfica de dados , dizem muito sobre histogramas: ambos estão mais interessados ​​e mais impressionados com outras representações. Esses são os livros mencionados aqui? Um livro que aborda histogramas como básico é Freedman, Pisani, Purves, Statistics .
Nick Cox
1
Na verdade, Cleveland não dizer algo sobre histogramas. Ele diz que eles são gráficos ruins e que não serão usados ​​em seu livro. :-). E F, P e P é um livro maravilhoso.
Peter Flom - Restabelece Monica
1
Eu ensinei no FPP. Eles não usariam explicitamente o OLS para prever a área de um retângulo, porque não fazem explicitamente regressão multivariada. Eles têm alguns exemplos nesse espírito, no entanto. Por exemplo, e se o Galileo tentasse prever o tempo t que leva um objeto a cair da altura h por regressão linear? Você obtém um bom mínimo de quadrados, mas é claro que a verdade é - a moral da história é sempre olhar para os resíduos. t=ch
Michael Lugo
1
@TrevorAlexander Essa é uma boa pergunta. Não conheço nenhuma literatura que mostre que a interpretação é melhor quando espelhada, mas elas parecem mais agradáveis ​​que os histogramas em uma orientação vertical, pelo menos para os meus olhos.
Ari B. Friedman