Sob quais condições as escalas Likert devem ser usadas como dados ordinais ou de intervalo?

52

Muitos estudos nas ciências sociais usam escalas Likert. Quando é apropriado usar os dados da Likert como ordinal e quando é apropriado usá-los como dados de intervalo?

Um leão
fonte
6
Escalas tecnicamente Likert são a soma de itens do tipo Likert e, como tal, acabam sendo uma aproximação razoável (pelo menos de acordo com muitos psicometristas em Psicologia) de um ponto de dados de intervalo.
22710 russellpierce
2
@drknexus - Então, vários itens servem como uma triangulação de medida para escalas de construção? Em caso afirmativo, quais são os critérios para determinar se um pesquisador possui pontos de dados relevantes suficientes (ou seja, itens) para usar a escala como uma medição de intervalo?
Um leão
2
Não tenho certeza; essa pode ser uma pergunta valiosa para a comunidade em geral. Eu acho que é provavelmente em parte um julgamento de valor por parte do pesquisador e da área. Algumas áreas estão completamente dispostas a tratar um único item do Likert como intervalo, mesmo que claramente seja ordinal. Uma resposta razoável pode ser o uso de um método de análise diferente, por exemplo, um teste de permutação ou de inicialização. Outra resposta pode ser a realização de um teste simples de normalidade, desde que o agregado não se afaste significativamente da normalidade, você provavelmente está bem.
russellpierce
11
... mas, em geral, parece que se pode evocar o teorema do limite central e sugerir que 20 a 30 itens sejam suficientes para usar a escala como uma medição de intervalo.
russellpierce

Respostas:

41

Talvez seja tarde demais, mas eu adiciono minha resposta de qualquer maneira ...

Depende do que você pretende fazer com seus dados: se você estiver interessado em mostrar que as pontuações diferem ao considerar diferentes grupos de participantes (sexo, país etc.), poderá tratá-las como valores numéricos, desde que cumpram as premissas usuais sobre variação (ou forma) e tamanho da amostra. Se você estiver interessado em destacar como os padrões de resposta variam entre os subgrupos, considere a pontuação dos itens como uma escolha discreta entre um conjunto de opções de resposta e procure modelagem log-linear, regressão logística ordinal, modelos de resposta a itens ou qualquer outro modelo estatístico que permite lidar com itens politômicos.

Como regra geral, geralmente se considera que ter 11 pontos distintos em uma escala é suficiente para aproximar uma escala de intervalo (para fins de interpretação, consulte o comentário de @ xmjx). Os itens do tipo Likert podem ser considerados como escala ordinal verdadeira, mas geralmente são usados ​​como numéricos e podemos calcular sua média ou DP. Isso geralmente é feito em pesquisas de atitude, embora seja prudente relatar média / DP e% de resposta nas, por exemplo, as duas categorias mais altas.

Ao usar pontuações na escala somada (ou seja, somamos a pontuação em cada item para calcular uma "pontuação total"), estatísticas usuais podem ser aplicadas, mas você deve ter em mente que agora está trabalhando com uma variável latente para que a construção subjacente deve fazer sentido! Em psicometria, geralmente verificamos que (1) a unidimensionalidade da escala é válida, (2) a confiabilidade da escala é suficiente. Ao comparar duas dessas pontuações na escala (para dois instrumentos diferentes), podemos até considerar o uso de medidas de correlação atenuadas em vez do coeficiente de correlação clássico de Pearson.

Os livros clássicos incluem:
1. Nunnally, JC e Bernstein, IH (1994). Teoria Psicométrica (3a ed.). Série McGraw-Hill em Psicologia.
2. Streiner, DL e Norman, GR (2008). Escalas de Medição em Saúde. Um guia prático para seu desenvolvimento e uso (4ª ed.). Oxford.
3. Rao, CR e Sinharay, S., Eds. (2007). Handbook of Statistics, vol. 26: Psicometria . Elsevier Science BV
4. Dunn, G. (2000). Estatísticas em Psiquiatria . Hodder Arnold.

Você também pode dar uma olhada em Aplicações de características latentes e modelos de classes latentes nas ciências sociais , da Rost & Langeheine, e no site da W. Revelle sobre pesquisa de personalidade .

Ao validar uma escala psicométrica, é importante considerar os chamados efeitos teto / piso (grande assimetria resultante de participantes que pontuam na categoria de resposta mais baixa / mais alta), o que pode afetar seriamente qualquer estatística calculada ao tratá-la como variável numérica ( por exemplo, agregação de países, teste t). Isso levanta questões específicas em estudos interculturais, uma vez que é sabido que a distribuição geral de respostas em pesquisas sobre atitudes ou saúde difere de um país para outro (por exemplo, o povo chinês versus o proveniente de países ocidentais tende a destacar um padrão de resposta específico, o primeiro tendo pontuações geralmente mais extremas no nível do item, consulte, por exemplo, Song, X.-Y. (2007) Análise de modelos de equações estruturais de várias amostras com aplicações em dados de Qualidade de Vida, emManual de Variáveis ​​Latentes e Modelos Relacionados , Lee, S.-Y. (Ed.), Pp 279-302, Holanda do Norte).

De maneira mais geral, você deve examinar a literatura relacionada à psicometria, que faz uso extensivo dos itens da Likert se estiver interessado no problema da medição. Vários modelos estatísticos foram desenvolvidos e atualmente estão sob a estrutura da Teoria da Resposta ao Item.

chl
fonte
2
Apenas para esclarecimento: Nunnally / Bernstein sugere tratar uma variável como contínua se ela tiver pelo menos 11 valores distintos (p. 115). De onde é essa regra prática "12 pontos implica escala de intervalo"?
xmjx
12

A resposta simples é que as escalas Likert são sempre ordinais. Os intervalos entre as posições na escala são monotônicos, mas nunca tão bem definidos que sejam incrementos numericamente uniformes.

Dito isto, a distinção entre ordinal e intervalo é baseada nas demandas específicas da análise que está sendo realizada. Sob circunstâncias especiais, você pode tratar as respostas como se elas caíssem em uma escala de intervalo. Para fazer isso, normalmente os entrevistados precisam estar em concordância quanto ao significado das respostas da escala e a análise (ou as decisões tomadas com base na análise) deve ser relativamente insensível aos problemas que possam surgir.

Tom
fonte
8
John Tukey escreveu o contrário (em 1960) em uma monografia "Data Analysis and Behavioral Science" (publicada em Collected Works v. III). Um resultado que ele obteve é ​​que, se você está melhor do que cerca de 10% de acordo com o teste e o reteste, sua escala não é estreita o suficiente!
whuber
Essa resposta parece confundir escalas Likert com itens de classificação originais. Veja o comentário de @ russellpierce.
Roland2
9

Além do que já foi dito acima sobre escalas somadas, eu também mencionaria que o problema pode mudar ao analisar dados no nível do grupo. Por exemplo, se você estivesse examinando

  • satisfação com a vida de estados ou países,
  • satisfação no trabalho de organizações ou departamentos,
  • satisfação do aluno nas disciplinas.

Em todos esses casos, cada medida agregada (talvez a média) é baseada em muitas respostas individuais (por exemplo, n = 50, 100, 1000, etc.). Nesses casos, o item Likert original começa a assumir propriedades que se assemelham a uma escala de intervalo no nível agregado.

Jeromy Anglim
fonte
-2

escala Likert sempre na forma ordinal: Um método para atribuir valor quantitativo a dados qualitativos, para torná-lo passível de análise estatística. Um valor numérico é atribuído a cada opção em potencial e um valor médio para todas as respostas é calculado no final da avaliação ou pesquisa.

mubashara hussain
fonte
5
Bem vindo ao nosso site! Atribua sua cotação ou, em geral, qualquer palavra que você esteja emprestando de outra pessoa.
whuber