Quais são as boas maneiras de visualizar um conjunto de respostas Likert?
Por exemplo, um conjunto de itens perguntando sobre a importância de X para as decisões de alguém sobre A, B, C, D, E, F & G? Existe algo melhor do que gráficos de barras empilhadas?
- O que deve ser feito com as respostas de N / A? Como eles podem ser representados?
- Os gráficos de barras devem relatar porcentagens ou número de respostas? (ou seja, as barras devem ter o mesmo comprimento?)
- Se houver porcentagens, o denominador deve incluir respostas inválidas e / ou N / A?
Eu tenho meus próprios pontos de vista, mas estou procurando as idéias de outras pessoas.
R
usuários que esse tipo de plotagem é implementado no pacoteHH
. Para lhe dar uma impressão, você pode tentarlikert(t(apply(data, 2, table)))
.Os gráficos de barras empilhados são geralmente bem compreendidos por não estatísticos, desde que sejam gentilmente introduzidos. É útil dimensioná-las em uma métrica comum (por exemplo, de 0 a 100%), com uma cor gradual para cada categoria, se esses itens forem ordinais (por exemplo, Likert). Prefiro dotchart (gráfico de pontos de Cleveland), quando não há muitos itens e não mais que 3-5 categorias de respostas. Mas é realmente uma questão de clareza visual. Geralmente, forneço%, pois é uma medida padronizada, e apenas reporto% e contagens com gráfico de barras não empilhado. Aqui está um exemplo do que quero dizer:
Melhor renderização pode ser alcançada com
lattice
ouggplot2
. Todos os itens têm as mesmas categorias de resposta neste exemplo em particular, mas, em casos mais gerais, podemos esperar categorias diferentes, para que a exibição de todos eles não pareça redundante, como é o caso aqui. Seria possível, no entanto, dar a mesma cor a cada categoria de resposta, a fim de facilitar a leitura.Mas eu diria que os gráficos de barras empilhados são melhores quando todos os itens têm a mesma categoria de resposta, pois ajudam a apreciar a frequência de uma modalidade de resposta entre os itens:
Também posso pensar em algum tipo de mapa de calor, que é útil se houver muitos itens com categoria de resposta semelhante.
As respostas ausentes (especialmente quando não negligenciáveis ou localizadas em um item / questão específico) devem ser relatadas, idealmente para cada item. Geralmente,% de respostas para cada categoria são calculadas sem NA. Isso é o que geralmente é feito em pesquisas ou em psicometria (falamos de "respostas expressas ou observadas").
PS Não consigo pensar em mais extravagantes coisas como a imagem mostrada abaixo (o primeiro foi feito à mão, o segundo é de
ggplot2
,ggfluctuation(as.table(tab))
), mas eu não acho que transmitir como informações precisas como dotplot ou barchart desde variações na superfície são difíceis de apreciar.fonte
Eu acho que a resposta do chl é ótima.
Uma coisa que devo acrescentar é o caso em que você deseja comparar a correlação entre os itens. Para isso, você pode usar algo como uma matriz de gráficos de dispersão de correlação para dados categóricos ordenados
(Esse código ainda precisa de alguns ajustes - mas dá a idéia geral ...)
fonte
pairs.panels
função nopsych
pacote de W Revelle.