Correlação de Spearman ou Pearson com escalas Likert onde linearidade e homoscedasticidade podem ser violadas

9

Estou querendo correlacionar uma série de medições em que as escalas Likert foram usadas. Observando os gráficos de dispersão, parece que as suposições de linearidade e homoscedasticidade podem ter sido violadas.

  • Dado que parece haver algum debate em torno da classificação do nível ordinal aproximando a escala do nível do intervalo, devo jogar pelo seguro e usar o Rho de Spearman em vez do r de Pearson?
  • Existe uma referência que eu possa citar se for com o Rho de Spearman?
whuber
fonte

Respostas:

13

Respostas anteriores neste site:

Perguntas relacionadas foram feitas algumas vezes neste site. Verificação de saída

Escalas versus itens:

Da minha experiência, há uma diferença entre executar análises em um item likert em oposição a uma escala likert. Uma escala likert é a soma de vários itens. Depois de somar vários itens, as escalas likert obtêm mais valores possíveis, a escala resultante é menos irregular. Tais escalas geralmente têm um número suficiente de pontos que muitos pesquisadores estão preparados para tratá-las como contínuas. Certamente, alguns argumentariam que isso é um pouco descuidado, e muito foi escrito em psicometria sobre a melhor forma de medir construções psicológicas e afins.

Prática padrão em ciências sociais:

De minhas observações casuais da leitura de artigos de periódicos em psicologia, a maioria das relações bivariadas entre escalas de likert de múltiplos itens é analisada usando o coeficiente de correlação de Pearson. Aqui, estou pensando em escalas como personalidade, inteligência, atitudes, bem-estar e assim por diante. Se você tem escalas como essa, vale a pena considerar que seus resultados serão comparados com resultados anteriores, nos quais a Pearson pode ter sido a escolha dominante.

Comparar métodos:

É um exercício interessante comparar o de Pearson com o de Spearman (e talvez até o tau de Kendall). No entanto, você ainda fica com a decisão de qual estatística usar e, em última análise, isso depende de qual definição você tem de associação bivariada.

Heterocedasticidade

Um coeficiente de correlação é um resumo preciso da relação linear entre duas variáveis, mesmo na ausência de homocedasticidade (ou talvez devêssemos dizer normalidade bivariada, uma vez que nenhuma variável é uma variável dependente).

Não-linearidade

Se houver uma relação não linear entre suas duas variáveis, isso é interessante. No entanto, ambas as variáveis ​​ainda podem ser tratadas como variáveis ​​contínuas e, portanto, você ainda pode usar as de Pearson. Por exemplo, a idade geralmente tem uma relação de U invertido com outras variáveis ​​como renda, mas a idade ainda é uma variável contínua.

Sugiro que você produza um gráfico de dispersão e ajuste alguns ajustes suavizados (como um spline ou LOESS) para explorar quaisquer relacionamentos não lineares. Se o relacionamento for realmente não linear, a correlação linear não é a melhor opção para descrever esse relacionamento. Você pode explorar a regressão polinomial ou não linear.

Jeromy Anglim
fonte
11
+1 por enfatizar a distinção entre itens Likert e escalas Likert.
ThomasH
2

Você certamente deve ir ao rho de Spearman ou ao tau de Kendall. Frequentemente, se os dados não são normais, mas as variações são iguais, você pode optar pelo r de Pearson, pois isso não faz muita diferença. Se as variações forem significativamente diferentes, você precisará de um método não paramétrico.

Você provavelmente poderia citar quase qualquer livro de estatística introdutória para apoiar o uso do Spearman's Rho.

Atualização: se a suposição de linearidade for violada, você não deverá usar o coeficiente de correlação de Pearson em seus dados, pois assume uma relação linear. O Rho de Spearman é aceitável sem linearidade e destina-se a relacionamentos monotônicos mais gerais entre as variáveis. Se você deseja usar o coeficiente de correlação de Pearson, pode ver o log transformando seus dados, pois isso pode lidar com a não linearidade.

richiemorrisroe
fonte
-1

Uma coisa é certa: a correlação requer linearidade no relacionamento em geral. agora você diz que seus dados têm um formato de curva, então a regressão não linear parece ser a escolha esquerda

THIRTHAALA NAAGA SAAYI KUMAAR
fonte
6
Eu não acho que isso seja "bastante certo". Somente a correlação de Pearson é uma medida de linearidade; indiscutivelmente, o ponto principal sobre outros tipos de correlação é que eles têm idéias mais relaxadas sobre o que conta como perfeição nos relacionamentos.
Nick Cox