Contexto:
Eu tenho dois conjuntos de dados do mesmo questionário executados ao longo de dois anos. Cada pergunta é medida usando uma escala de 5-Likert.
Q1: esquema de codificação
No momento, codifiquei minhas respostas em um intervalo [0, 1], com 0 significando "resposta mais negativa", 1 significando "resposta mais positiva" e outras respostas espaçadas igualmente.
- Qual é o "melhor" esquema de codificação a ser usado na escala Likert?
Sei que isso pode ser um pouco subjetivo.
Q2: importância ao longo dos anos
- Qual é a melhor maneira de determinar se há mudanças estatisticamente significativas ao longo dos dois anos?
Ou seja, analisando os resultados da pergunta 1 de cada ano, como saber se a diferença entre o resultado de 2011 e o resultado de 2010 é estatisticamente significativa? Tenho uma vaga lembrança de que o teste t de Student é útil aqui, mas não tenho certeza.
O Teste Wilcoxon Ranksum, também conhecido como Mann-Whitney, é o caminho a seguir no caso de dados ordinais. A solução de bootstrapping também é elegante, embora não seja o caminho "clássico" a seguir. O método Bootstrapping também pode ser valioso caso você busque outras coisas, como análise fatorial. No caso de análise de regressão, você pode escolher probit ordenado ou logit ordenado como uma especificação de modelo.
BTW: Se sua escala tiver um intervalo maior (> 10 valores por variável), você poderá usar os resultados como uma variável métrica, o que torna o teste t uma escolha segura. Lembre-se de que isso é um pouco sujo e pode ser considerado trabalho do diabo por alguns.
stephan
fonte