Modelagem de equações estruturais de medidas repetidas

10

Eu preciso analisar um conjunto de dados de dados de reabilitação clínica. Estou interessado em relações baseadas em hipóteses entre "entrada" quantificada (quantidade de terapia) e alterações no estado de saúde. Embora o conjunto de dados seja relativamente pequeno (n ~ 70), temos dados repetidos que refletem mudanças temporais em ambos. Eu estou familiarizado com a modelagem de efeitos mistos não lineares em R, mas estou interessado em possíveis relações "causais" entre entrada e saída aqui e, portanto, estou considerando aplicações de medidas repetidas do SEM

Eu gostaria de receber conselhos sobre se algum dos pacotes SEM para R (sam, lavaan, openmx?) É mais adequado para dados de medidas repetidas e, particularmente, recomendações para livros didáticos (existe um "Pinheiro e Bates" no campo?) .

RobF
fonte
2
Por que você acha que precisa do SEM? Se você ouviu o hype de que o SEM resolve todos os problemas causais, é um exagero, apenas experimentos aleatórios ideais o fazem. Veja a referência que dei na minha resposta abaixo.
StasK
11
Quando você diz n ~ 70, você quer dizer 70 pacientes medidos ao longo do tempo ou 70 medições (digamos 7 pacientes em 10 momentos diferentes)? Estou apenas aprendendo o SEM, mas uma coisa que notei até agora é que ele assume grandes conjuntos de dados (eles falam de mais de 200 ou mais), para que você possa acabar se frustrando / se enganando.
7113 Wayne

Respostas:

5

Eu acho que você quer um modelo de curva de crescimento latente. Embora eu tenha usado apenas LISRELisso, o lavaan package documentationindica que ele pode ser usado para se ajustar a esse tipo de modelo.

Não conheço nenhum livro especializado neste assunto, o livro do qual estou trabalhando para o SEM abrange vários métodos. Talvez alguém possa responder a esse aspecto da sua pergunta.

Michelle
fonte
2
(+1) De fato, os modelos de curva de crescimento e mistura de VE estão entre alguns dos tópicos "quentes" em MEV ou psicometria; eles são abordados em alguns livros recentes, como Latent Variable Mixture Models (Hancock & Samuelsen, 2008). Tenho outros documentos na minha lista TOBEREADFORTOOLONG e recomendo examinar o trabalho de Múthen and coll., Em conjunto com o que o software Mplus oferece para esse fim específico . Se eu encontrar algum tempo para reler a literatura e comparar lavaan/ Mx com Mplus, eu mesmo postarei uma resposta.
chl
Isso seria bom, porque eu acabei de aprender modelos de curva de crescimento latente, e eles realmente são um modelo único comparado a outros tipos de SEM.
317 Michelle
4

Não, não há "Pinheiro e Bates". Você pode encontrar vários livros intitulados como "SEM usando AMOS / LISREL / Mplus", mas não conheço nenhum que esteja usando R. O melhor livro, matematicamente falando, sobre SEM ainda é Bollen (1989) . Ele foi escrito por um sociólogo e não por um bioestatístico (embora seja muito bom!), E é voltado para cientistas sociais, e contém poucas referências a software (e você não quer o software há 25 anos, pelo menos) . Bollen também foi co-autor de um bom artigo recentemente sobre causalidade com a Judea Pearl, veja http://ftp.cs.ucla.edu/pub/stat_ser/r393.pdf . Até onde sei, Mulaik (2009) também deve ser bom, mas foi escrito por um psicólogo para psicólogos.

Eu não acho que o pacote sem é flexível o suficiente para executar esse tipo de coisa. O OpenMx pode lidar com dados ordinais (e, portanto, resultados binários), mas não acho que o lavaan possa fazer isso.

O software que você conceitualmente achará o mais fácil de lidar pode ser o GLLAMM , um pacote escrito para a Stata . Visto de uma maneira, esta é essencialmente uma encarnação do Stata nlme. Com um ajuste extra (permitindo que os coeficientes dos efeitos aleatórios variem de acordo com os valores de outras variáveis), ele se torna um pacote de modelagem de variáveis ​​latentes. Tudo isso está descrito em Skrondal e Rabe-Hesketh (2004) ... que é um ótimo livro em si que você gostaria de ter, mesmo que apenas o faça nlme.

StasK
fonte
(+1) Boas referências. (Sobre gllamm, visto de outra forma - a partir da perspectiva de um psicometrista usado para modelos da TRI: é apenas terrivelmente lenta :-)
chl
@chl, escreva sua própria probabilidade;). Foi o que fiz com polychoric, por exemplo, quando precisei.
StasK
2

Como você se sente confortável com modelos mistos lineares generalizados e não sugere que esteja interessado em variáveis ​​latentes, talvez queira adotar uma abordagem por partes usando a lmerqual poderá avaliar usando um teste D-Sep. Veja Shipley, B. (2009). Análise de caminho confirmatório em um contexto multinível generalizado. Ecology, Ecology, 90, 363-368. http://dx.doi.org/10.1890/08-1034.1 para um exemplo. Ele também fornece o código R no apêndice para saber como calcular o teste de separação D.

Se você realmente deseja entrar em modelagem de variáveis ​​latentes e SEM usando a máxima probabilidade, confira http://lavaan.org - há um ótimo tutorial que aborda suas capacidades, bem como uma seção sobre modelos de curvas de crescimento latentes que podem ser o que você está atrás.

jebyrnes
fonte