Visualizando dados de resposta do item Likert

25

Quais são as boas maneiras de visualizar um conjunto de respostas Likert?

Por exemplo, um conjunto de itens perguntando sobre a importância de X para as decisões de alguém sobre A, B, C, D, E, F & G? Existe algo melhor do que gráficos de barras empilhadas?

  • O que deve ser feito com as respostas de N / A? Como eles podem ser representados?
  • Os gráficos de barras devem relatar porcentagens ou número de respostas? (ou seja, as barras devem ter o mesmo comprimento?)
  • Se houver porcentagens, o denominador deve incluir respostas inválidas e / ou N / A?

Eu tenho meus próprios pontos de vista, mas estou procurando as idéias de outras pessoas.

chl
fonte

Respostas:

30

Eu gosto da visualização da contagem centralizada. Esta versão em particular remove as respostas neutras (tratando efetivamente o neutro e n / a como o mesmo) para mostrar apenas a quantidade de opiniões de concordar / discordar. O ponto 0 é onde o vermelho e o azul se encontram. O eixo da contagem é cortado.

texto alternativo

Para comparação, aqui estão as mesmas cinco respostas que as porcentagens empilhadas, mostrando neutro (cinza) e sem resposta (branco).

texto alternativo

Atualização: Artigo sugerindo um método semelhante: plotagem de Likert e outras escalas de classificação (PDF)

xan
fonte
2
(+1) Interessante! Qual software você usa? Apenas uma observação: não há indicação sobre valores absolutos para% ou count, portanto isso parece permitir apenas uma interpretação relativa.
chl
Desculpe, eu não li sua última frase (o eixo x é invisível). Tentarei outra observação: Alguma chance de obter as contagens de NA visíveis na visão centralizada (ou seja, distingui-las de neutras)?
chl
@chl Obrigado. Eu uso o JMP, no qual sou pago para trabalhar. O primeiro é um gráfico de barras empilhadas com valores positivos e negativos, o que deve ser possível em muitas ferramentas. As contagens de NA poderiam ser feitas de maneiras diferentes (em uma extremidade, divididas em ambas as extremidades, no meio, coluna separada) e nenhuma parece obviamente melhor para a maioria das situações.
quer
2
Só queria adicionar aos Rusuários que esse tipo de plotagem é implementado no pacote HH. Para lhe dar uma impressão, você pode tentar likert(t(apply(data, 2, table))).
hplieninger
11
Penso que a referência é "B Robbins, Naomi; M Heiberger, Richard (2011)." Plotando Likert e outras escalas de classificação ". JSM 2011: 1058-1066."
Kit Johnson
23

Os gráficos de barras empilhados são geralmente bem compreendidos por não estatísticos, desde que sejam gentilmente introduzidos. É útil dimensioná-las em uma métrica comum (por exemplo, de 0 a 100%), com uma cor gradual para cada categoria, se esses itens forem ordinais (por exemplo, Likert). Prefiro dotchart (gráfico de pontos de Cleveland), quando não há muitos itens e não mais que 3-5 categorias de respostas. Mas é realmente uma questão de clareza visual. Geralmente, forneço%, pois é uma medida padronizada, e apenas reporto% e contagens com gráfico de barras não empilhado. Aqui está um exemplo do que quero dizer:

data(Environment, package="ltm")
Environment[sample(1:nrow(Environment), 10),1] <- NA
na.count <- apply(Environment, 2, function(x) sum(is.na(x)))
tab <- apply(Environment, 2, table)/
       apply(apply(Environment, 2, table), 2, sum)*100
dotchart(tab, xlim=c(0,100), xlab="Frequency (%)", 
         sub=paste("N", nrow(Environment), sep="="))
text(100, c(2,7,12,17,22,27), rev(na.count), cex=.8)
mtext("# NA", side=3, line=0, at=100, cex=.8)

texto alternativo

Melhor renderização pode ser alcançada com latticeou ggplot2. Todos os itens têm as mesmas categorias de resposta neste exemplo em particular, mas, em casos mais gerais, podemos esperar categorias diferentes, para que a exibição de todos eles não pareça redundante, como é o caso aqui. Seria possível, no entanto, dar a mesma cor a cada categoria de resposta, a fim de facilitar a leitura.

Mas eu diria que os gráficos de barras empilhados são melhores quando todos os itens têm a mesma categoria de resposta, pois ajudam a apreciar a frequência de uma modalidade de resposta entre os itens:

texto alternativo

Também posso pensar em algum tipo de mapa de calor, que é útil se houver muitos itens com categoria de resposta semelhante. texto alternativo

As respostas ausentes (especialmente quando não negligenciáveis ​​ou localizadas em um item / questão específico) devem ser relatadas, idealmente para cada item. Geralmente,% de respostas para cada categoria são calculadas sem NA. Isso é o que geralmente é feito em pesquisas ou em psicometria (falamos de "respostas expressas ou observadas").

PS Não consigo pensar em mais extravagantes coisas como a imagem mostrada abaixo (o primeiro foi feito à mão, o segundo é de ggplot2, ggfluctuation(as.table(tab))), mas eu não acho que transmitir como informações precisas como dotplot ou barchart desde variações na superfície são difíceis de apreciar. texto alternativo

texto alternativo

chl
fonte
2
BTW, Uma pergunta sobre as respostas da escala de Graphing Likert acabou de aparecer no blog de Andrew Gelman ontem :) j.mp/aBm8mZ
chl
14

Eu acho que a resposta do chl é ótima.

Uma coisa que devo acrescentar é o caso em que você deseja comparar a correlação entre os itens. Para isso, você pode usar algo como uma matriz de gráficos de dispersão de correlação para dados categóricos ordenados

texto alternativo

(Esse código ainda precisa de alguns ajustes - mas dá a idéia geral ...)

Tal Galili
fonte
3
(+1) Isso me lembra a pairs.panelsfunção no psychpacote de W Revelle.
chl
Interessante. Eu encontrei esse código, mas nunca soube que ele também existia no pacote psych. Estou certo de que me inspirou de alguma maneira quando eu escrevi esse post (Devo acrescentar que isso os créditos sobre o post ...)
Tal Galili