Escolha de pesos de caminho em modelos conceituais SEM para gêmeos idênticos e fraternos usando openMx

10

Estou revendo o pacote R OpenMx para uma análise de epidemiologia genética, a fim de aprender como especificar e ajustar modelos SEM. Eu sou novo nisso, então tenha paciência comigo. Estou seguindo o exemplo na página 59 do Guia do Usuário OpenMx . Aqui eles desenham o seguinte modelo conceitual:

Modelos SEM para gêmeos idênticos e fraternos

E, ao especificar os caminhos, eles definem o peso do nó "um" latente para os nós bmi manifestos "T1" e "T2" como 0,6 porque:

Os principais caminhos de interesse são os de cada uma das variáveis ​​latentes para a respectiva variável observada. Eles também são estimados (portanto, todos são liberados), obtêm um valor inicial de 0,6 e rótulos apropriados.

# path coefficients for twin 1
mxPath(
  from=c("A1","C1","E1"),
  to="bmi1",
  arrows=1,
  free=TRUE,
  values=0.6,
  label=c("a","c","e")
),

# path coefficients for twin 2
mxPath(
  from=c("A2","C2","E2"),
  to="bmi2",
  arrows=1,
  free=TRUE,
  values=0.6,
  label=c("a","c","e")
),

O valor de 0,6 vem da covariância estimada de bmi1e bmi2(de pares gêmeos estritamente mono zigóticos). Eu tenho duas perguntas:

  1. Quando eles dizem que o caminho recebe um valor "inicial" de 0,6, é como definir uma rotina de integração numérica com valores iniciais, como na estimativa de GLMs?

  2. Por que esse valor é estimado estritamente a partir dos gêmeos monozigóticos?

AdamO
fonte

Respostas:

4

Para responder aos seus 2 pontos:

1) Sim, exatamente - o valor inicial é apenas ditar onde o algoritmo iniciará o processo de otimização. A maioria dos pacotes de software, na verdade, determina seu próprio valor inicial por padrão, e o usuário precisa inserir valores diferentes apenas quando ocorrerem problemas durante a estimativa. Pela minha experiência, os valores iniciais mais plausíveis funcionarão e não mudarão o modelo final no qual o algoritmo converge.

2) O valor 0.6 é o valor inicial, não para a interceptação de T1 e T2 (caminho entre "um" e T1 e T2), mas é o valor inicial para as cargas fatoriais que ligam cada variável latente (A, C, E ) ao indicador T1 ou T2. Isso é indicado pelo fato de o caminho seguir from=c("A1","C1","E1"), to="bmi1"no primeiro caso e from=c("A2","C2","E2"), to="bmi2"no segundo caso.

Quanto ao valor específico "0,6": não foi possível encontrar na documentação onde eles mencionam a obtenção desse valor com base no subgrupo de gêmeos monozigóticos; e, na verdade, essas estimativas de parâmetros (cargas fatoriais para as três variáveis ​​latentes) não podem ser calculadas diretamente da amostra, pois, por definição, essas variáveis ​​latentes não são observadas (são latentes). Como mencionei no ponto 1, raramente a escolha entre dois valores plausíveis afetará as estimativas de parâmetros do modelo convergido, portanto, meu palpite é que eles simplesmente escolheram um dos muitos valores plausíveis para essas cargas fatoriais como valores iniciais. Se esse valor provém da covariância estimada entre bmi1 e bmi2 apenas no subgrupo monozigótico-gêmeo deve ser irrelevante, pois qualquer valor inicial plausível deve levar o algoritmo a convergir para os mesmos valores finais, talvez com algumas diferenças no tempo de computação. (E meu conselho para se convencer é: tente! Experimente vários valores iniciais e compare as estimativas de parâmetros dos modelos convergidos.)

Como observação geral, mostrarei que a escolha dos valores iniciais para qualquer estimativa de parâmetro se torna MUITO importante se o argumento freefor definido como FALSE, porque o valor inicial se tornará efetivamente o valor da estimativa de parâmetro no modelo final (não será ser estimado; é fixado antes da estimativa).

Patrick Coulombe
fonte