Ao plotar um boxplot com python matplotblib, as linhas na metade do gráfico são a mediana da distribuição.
Existe a possibilidade de ter a linha na média. Ou para plotá-lo ao lado dele em um estilo diferente.
Além disso, como é comum a linha ser a mediana, isso realmente confundirá meus leitores se eu fizer a média (claro que acrescentarei uma nota sobre a linha do meio)?
data-visualization
python
matplotlib
boxplot
Peter Smit
fonte
fonte
Para responder à sua segunda pergunta: Sim, acho que será confuso colocar a linha na média em vez da mediana. As regras precisas que controlam a duração dos bigodes (se houver) e o tratamento dos discrepantes variam, mas todos mantêm o uso da caixa por Tukey, exibindo a mediana e os quartis inferior e superior. Para distribuições altamente inclinadas, a média pode estar fora da caixa, o que pareceria muito estranho. O uso comum é que a mediana segue o intervalo interquartil, enquanto a média segue o desvio padrão (ou erro padrão da média se você estiver interessado em inferência e não na descrição dos dados). Se você quiser mostrar a média visualmente, eu usaria um símbolo diferente para exibi-lo para evitar confusão.
fonte