Pode-se reduzir validamente o número de itens em uma escala Likert publicada?

11

[edições feitas em resposta ao feedback- obrigado :-)]

Doh! Mais edições! Desculpe!

Olá-

Estou fazendo uma coleta de dados um tanto grosseira e pronta com uma pesquisa enviada à equipe de saúde usando uma escala publicada sobre moral e outros problemas desse tipo.

A única coisa é que a escala é bastante longa com todas as outras coisas da pesquisa e eu gostaria de reduzir seu tamanho cortando cada subescala pela metade e usando apenas a metade dos itens. Minha intuição é que isso é bom, uma vez que as subescalas são inter-correlacionadas e, embora não seja ideal para a pesquisa com padrão de publicação, tudo bem apenas para um pouco de descoberta de fatos intra-organizacionais.

Eu me perguntava se alguém pensava sobre a validade de fazer isso, armadilhas ou qualquer outra coisa. As referências são particularmente recebidas com gratidão, porque meus colegas precisarão de algum convencimento!

Muito obrigado, Chris B

Editar% s-

Sim, é uma escala validada com propriedades psicométricas conhecidas.

É unidimensional e tem subescalas, se é o caminho certo para colocá-lo.

Estarei trabalhando na subescala e no total, não no item, nível.

30 itens, provavelmente cerca de 40-60 indivíduos.

Felicidades!

Chris Beeley
fonte
Esta é uma escala validada, com propriedades psicométricas conhecidas?
chl
Olá Chris, você não está reduzindo o número de itens em uma escala Likert, mas sim usando menos perguntas / itens (que são medidos em uma escala Likert). Em geral, parece que depende de suas medidas. Você pode verificar a correlação dos itens que pretende retirar com os que está mantendo. Na verdade, é interessante medir o quanto remover - pode valer a pena reformular a pergunta dessa maneira (se você não quiser, talvez eu faça isso mais tarde). Boa pergunta :)
Tal Galili
Três perguntas adicionais: (1) Essa é uma escala unidimensional ou existem várias subescalas, (2) Qual é o número de indivíduos e o número de itens e (3) Você trabalha no nível dos itens ou no total ou pontuação média?
chl

Respostas:

11

Embora ainda exista alguma informação (Nº de indivíduos e itens por subescala), aqui estão algumas dicas gerais sobre redução de escala. Além disso, como você está trabalhando no nível do questionário, não vejo por que o tamanho é tão importante (afinal, você fornecerá apenas estatísticas resumidas, como pontuação total ou média).

Devo assumir que (a) você tem um conjunto de itens K medindo algum construto relacionado ao moral, (b) sua escala "unidimensional" é um fator de segunda ordem que pode ser subdividido em diferentes facetas, (c) você gostaria de reduza sua escala para k <K itens, de modo a resumir com precisão suficiente as pontuações totais da escala dos sujeitos, preservando a validade do conteúdo da escala.

Sobre a validade do conteúdo / construto desta escala validada: O número de itens certamente foi escolhido para refletir melhor o construto de interesse. Ao encurtar o questionário, você está realmente reduzindo a cobertura de construção. Seria bom verificar se a estrutura fatorial permanece a mesma ao considerar apenas metade dos itens (o que também pode afetar a maneira como você os seleciona). Isso pode ser feito usando técnicas tradicionais de FA. Você tem a responsabilidade de interpretar a balança em um espírito semelhante ao dos autores.

Sobre a confiabilidade das pontuações : Embora seja uma medida dependente da amostra, a confiabilidade das pontuações diminui ao diminuir o número de itens (cf. fórmula de Spearman-Brown ); outra maneira de ver isso é que o erro padrão de medição (SEM) aumentará, mas consulte um Módulo Instrucional NCME sobre Erro Padrão de Medição , de Leo M Harvill. Escusado será dizer que se aplica a todos os indicadores que dependem do número de itens (por exemplo, o alfa de Cronbach, que pode ser usado para estimar uma forma de confiabilidade, a consistência interna). Felizmente, isso não afetará nenhuma comparação entre grupos com base em pontuações brutas.

Portanto, minhas recomendações (a maneira mais fácil) seriam:

  1. Selecione seus itens para maximizar a cobertura da construção; verificar a dimensionalidade com FA e a cobertura com distribuições de respostas univariadas;
  2. Compare as correlações interitem médias com as relatadas anteriormente;
  3. Calcular a consistência interna para a escala completa e seus compósitos; verifique se estão de acordo com as estatísticas publicadas na escala original (não é necessário testar nada, são medidas dependentes da amostra);
  4. Teste as correlações lineares (ou policóricas ou de classificação) entre as pontuações originais e as (sub) pontuações reduzidas, para garantir que sejam comparáveis ​​(ou seja, que os locais dos indivíduos no traço latente não variem em grande parte, como objetivado pelas pontuações brutas) );
  5. Se você tiver uma variável externa específica de um assunto (por exemplo, sexo, idade ou melhor medida relacionada ao moral), compare a validade do grupo conhecido entre as duas formas.

A maneira mais difícil seria confiar na Teoria da resposta ao item para selecionar os itens que contêm o máximo de informações sobre a redução da escala de características latentes, na verdade, é uma de suas melhores aplicações. Modelos para itens politômicos foram parcialmente descritos neste tópico, Validando questionários .

Atualize após sua 2ª atualização

  1. Esqueça os modelos de TRI para itens politômicos com tão poucos assuntos.
  2. A análise fatorial também sofrerá com um tamanho de amostra tão baixo; você obterá estimativas não confiáveis ​​de cargas fatoriais.
  3. 30 itens divididos por 2 = 15 itens (é fácil ter uma idéia do aumento no SEM correspondente para a pontuação total), mas definitivamente ficará pior se você considerar as subescalas (essa era realmente a minha segunda pergunta - itens no. por subescala, se houver)
chl
fonte
8

Acho que não há uma resposta clara "sim / não" à sua pergunta. Se você soltar arbitrariamente itens de subescalas para criar uma forma abreviada do questionário original, perderá a validação psicométrica da forma longa. As coisas que podem mudar são a estrutura fatorial do questionário, a confiabilidade das subescalas, as correlações entre itens totais, etc. (você notará que estou acostumado ao pensamento clássico da teoria dos testes, não à TRI). Além disso, você não pode usar nenhuma padronização do questionário original. É por isso que as formas curtas de questionários estabelecidos precisam passar por uma fase de validação separada.

Dependendo de suas necessidades, nem tudo está perdido. Você pode não precisar de padronização, pois pode comparar apenas os resultados em sua amostra sem fazer julgamentos "absolutos" em relação a uma população de referência. IMHO, seria uma vantagem se você tivesse a chance de validar o formulário curto com o formulário original, pelo menos para uma subamostra do seu grupo. Isso pode permitir que você veja se os resultados são semelhantes.

Porém, em geral, os resultados de um questionário podem ser surpreendentemente sensíveis à sua composição de itens. As pessoas não preenchem roboticamente os questionários, mas fazem todos os tipos de suposições tácitas e inferências cognitivas: "do que se trata realmente?", "O que devo informar aqui?", "O que elas realmente querem saber?". Isso pode ser fortemente influenciado pelo contexto determinado dos itens, cf. Schwarz, N. 1996. Cognição e Comunicação: Viéses Julgadores, Métodos de Pesquisa e a Lógica da Conversação. Mahwah, NJ: Lawrence Erlbaum.

caracal
fonte
4

Eu acrescentaria um ponto.

Esteja ciente da distinção entre grupo (por exemplo, comparação de médias de grupo ao longo do tempo) e medição em nível individual (por exemplo, correlação de pontuações na escala com outras escalas no nível individual).

A confiabilidade se aplica de maneira diferente aos dois níveis. Talvez a seguinte simplificação ajude:

  • A confiabilidade da medição no nível do grupo é fortemente influenciada pelo número de participantes que você possui e pelo grau em que existe uma verdadeira variabilidade no nível do grupo.
  • A confiabilidade da medição no nível individual é fortemente influenciada pelo número de itens que você possui e pelo grau em que os indivíduos realmente variam.
Jeromy Anglim
fonte