Erro ao relatar com representações medianas e gráficas?

11

Usei uma grande variedade de testes para os meus dados de tese, de ANOVAs paramétricos e testes t a testes não-paramétricos de Kruskal-Wallis e Mann-Whitneys, bem como ANOVAs de duas vias com transformações de classificação e GzLMs com binários, poisson e dados proporcionais. Agora preciso relatar tudo enquanto escrevo tudo isso nos meus resultados.

Eu já perguntei aqui como relatar intervalos de confiança assimétricos para dados de proporção. Eu sei que o desvio padrão, erro padrão ou intervalos de confiança são apropriados para as médias, que é o que eu reportaria se todos os meus testes fossem bem paramétricos. No entanto, para meus testes não paramétricos, devo reportar medianas e não meios? Em caso afirmativo, que erro eu reportaria?

Associado a isso, está a melhor forma de apresentar graficamente os resultados dos testes não paramétricos. Como em grande parte tenho dados contínuos ou de intervalo dentro de categorias, geralmente uso gráficos de barras, com a parte superior da barra sendo as barras de média e erro que mostram 95% de IC. Para testes NP, ainda posso usar gráficos de barras, mas a parte superior da barra representa a mediana?

Obrigado por suas sugestões!

Mog
fonte
Algo não computa. Como você pode ter meios, medianas ou ICs com dados categóricos?
Roland2
Desculpe, não ficou claro @ rolando2 ... Tenho categorias nas quais tenho dados contínuos ou com intervalo (a pergunta original foi editada para esclarecer agora).
Mog

Respostas:

6

Você pode relatar um intervalo de confiança para a mediana. Em R, você pode usar wilcox.testcom o argumento conf.int=TRUE. Há uma pequena discussão sobre isso em João Verzani 's notas simples : veja aqui .

Em relação aos gráficos: eu realmente não gosto de usar gráficos de barras, mesmo para representar um conjunto de meios. Prefiro plotar apenas pequenos segmentos de linha para o IC: parcelas de barra melhoradas

A plotagem à direita foi feita com errbar()o pacote Hmisc [ página CRAN ].

Você pode fazer o mesmo tipo de gráfico para as medianas e os intervalos de confiança relacionados, ou usar gráficos de caixas (que, na mesma quantidade de espaço, descrevem toda a distribuição).

Karl
fonte
Obrigado pelas dicas Karl! Existe um motivo específico para você não gostar de bares ou é uma preferência pessoal?
Mog11
1
@ Mog: As barras parecem um desperdício de tinta / espaço; forçam você a incluir 0 no eixo y, o que geralmente não é necessário; e impedem que você mostre as metades inferiores dos intervalos. As barras podem piorar (por exemplo, com 3d gratuito). Com pequenos conjuntos de dados, prefiro mostrar os pontos de dados reais.
Karl