Quais são as principais diferenças entre análises taxométricas (por exemplo, MAXCOV, MAXEIG) e análises de classe latente?

8

Pesquisas recentes tentaram determinar se certas construções psicológicas são latentemente dimensionais ou taxônicas (isto é, incluindo táxons ou classes). Por exemplo, os pesquisadores podem estar interessados ​​em descobrir se existe uma certa "classe" de pessoas com maior probabilidade de desenvolver dor crônica após uma lesão ou se o risco de desenvolver dor crônica é melhor conceituado como dimensional, variando de risco limitado a risco extremamente alto. Percebi que os pesquisadores tentam responder a esses tipos de perguntas usando dois tipos de análise: análises taxométricas (MAMBAC, MAXEIG, MAXCOV) normalmente conduzidas em análises de classe R e latente.

Aqui estão alguns exemplos de estudos taxométricos:

Aqui estão alguns exemplos usando análises de classe latente:

Aqui estão as minhas perguntas:

  1. Em inglês, quais são as principais diferenças entre esses dois tipos de análise? Se possível, especifique se eles respondem a perguntas diferentes e como são analiticamente (matematicamente) diferentes.

  2. Qual é o melhor para responder ao tipo de pergunta que destaquei na minha "introdução" e por quê? Talvez isso seja realmente sem resposta neste momento.

Compartilhe também qualquer informação que considere relevante para este tópico. Sinto que terei perguntas de acompanhamento!

Behacad
fonte

Respostas:

7

Veja Tueller (2010) , Tueller e Lubke (2010) e [Ruscio et al.'l book] [3] para obter detalhes completos sobre o que está resumido abaixo. Os procedimentos taxométricos geralmente funcionam computando estatísticas simples no subconjunto de dados classificados. MAMBAC usa a média, MAXCOV usa a covariância e MAXEIG usando o valor de eigen. A análise de classe latente é um caso especial do modelo geral de mistura variável latente (LVMM). O LVMM especifica um modelo para os dados que podem incluir classes latentes, fatores latentes ou ambos. Os parâmetros do modelo são obtidos usando a máxima verossimilhança ou estimativas bayesianas. Consulte a literatura acima para obter detalhes completos.

O que é mais importante que os fundamentos matemáticos (que estão além do escopo deste fórum) são as hipóteses que podem ser testadas em cada abordagem. Os procedimentos taxométricos testam a hipótese

H1: Duas classes explicam toda (ou a maioria) da correlação observada entre um conjunto de indicadores. H0: Uma (ou mais) dimensão (s) subjacente (s) contínua (s) explica toda a correlação observada entre um conjunto de indicadores.

Normalmente, o CCFI é usado para determinar qual hipótese rejeitar / reter. Veja [o livro de John Ruscio sobre o tema] [4]. Os procedimentos taxométricos podem testar apenas essas duas hipóteses e nenhuma outra.

Usada sozinha, a análise de classe latente não pode testar a hipótese alternativa taxométrica, H0 acima. No entanto, a análise de classe latente pode testar as seguintes hipóteses alternativas:

H1a: Duas classes explicam toda a correlação observada entre um conjunto de indicadores H1b: Três classes explicam toda a correlação observada entre um conjunto de indicadores ... As classes H1k: k explicam toda a correlação observada entre um conjunto de indicadores

Para testar H0 de cima em uma estrutura de variáveis ​​latentes, ajuste um modelo de análise fatorial confirmatória de fator único (CFA) aos dados (chame este H0cfa que é diferente de H0 - H0 apenas testa uma hipótese de ajuste sob a estrutura taxométrica, mas não ' t produza estimativas de parâmetros como você obteria ajustando um modelo CFA). Para comparar H0cfa a H1a, H1b, ..., H1k, use o critério Bayesian Information Criterion (BIC) ala [Nylund et al. (2007)] [5].

Para resumir até agora, os procedimentos taxométricos podem considerar soluções de duas vs. uma classe, enquanto a classe latente + CFA pode testar uma vs. duas ou mais soluções de classe. Vimos que os procedimentos taxométricos testam um subconjunto das hipóteses testadas por comparações de modelos de classe latente + CFA.

Todas as hipóteses presentes até agora são extremos nas duas extremidades de um espectro. A hipótese mais geral é que algum número de classes latentes e algum número de dimensões latentes (ou fatores latentes) explicam melhor os dados. As abordagens descritas acima rejeitam isso diretamente, o que é uma suposição muito forte. Em outras palavras, um modelo de classe latente e um procedimento taxométrico que leva a uma conclusão da estrutura taxônica (em vez de dimensional) assumem dentro da classe diferenças individuais, além do erro aleatório. No seu contexto, isso equivale a dizer que dentro da classe de dor crônica, não há variação sistemática na tendência de desenvolver dor crônica, apenas chance aleatória.

A fraqueza dessa suposição é melhor ilustrada com um exemplo da psicopatologia. Digamos que você tenha um conjunto de indicadores para depressão, e seus modelos de classe taxométrica e / ou latente o levam a concluir que há uma classe deprimida e uma classe não deprimida. Esses modelos implicitamente não assumem variação na gravidade da depressão dentro da classe (além de erros ou ruídos aleatórios). Em outras palavras, você está deprimido, ou não, e entre os deprimidos todos estão igualmente deprimidos (além da variação nas variáveis ​​observadas propensas a erros). Portanto, precisamos apenas de um tratamento para depressão em um nível de dose! É fácil perceber que essa suposição é absurda para a depressão e, muitas vezes, é igualmente limitada para a maioria dos outros contextos de pesquisa.

Para evitar fazer essa suposição, use uma abordagem de modelagem de mistura fatorial seguindo os documentos de [Lubke e Muthen e Lubke e Neale] [6].

stueller
fonte
(+1) Bem-vindo ao nosso site e obrigado por contribuir com uma resposta tão bem desenvolvida!
whuber
Uau! Eu quase sinto que você se registrou apenas para responder a esta pergunta. Obrigado, muito esclarecedor. Você poderia elaborar maneiras de evitar as limitações destacadas? Estou assumindo que tem a ver com invariância fraca (e similar)? O programa que eu uso tem a capacidade de tornar as variações de erros independentes, as covariâncias de erros e os efeitos de fatores independentes. Sinto que essa talvez seja a direção certa, mas, devido à terminologia diferente, é difícil ter certeza.
precisa saber é o seguinte