Modelagem linear de efeitos mistos com dados de estudos gêmeos

14

Suponhamos que tem alguns alguma variável resposta yij que foi medido a partir de j th irmão em th família. Além disso, alguns dados comportamentais foram coletados ao mesmo tempo de cada sujeito. Estou tentando analisar a situação com o seguinte modelo linear de efeitos mistos:ixij

yij=α0+α1xij+δ1ixij+εij

onde e são a interceptação e a inclinação fixas, respectivamente, é a inclinação aleatória e é o resíduo.α0α1δ1iεij

As suposições para os efeitos aleatórios e residual são (supondo que haja apenas dois irmãos em cada família)δ1iεij

δ1idN(0,τ2)(εi1,εi2)TdN((0,0)T,R)

onde é um parâmetro de variância desconhecido e a estrutura de variância-covariância R é uma matriz simétrica 2 x 2 da formaτ2R

(r12r122r122r22)

que modela a correlação entre os dois irmãos.

  1. Esse é um modelo apropriado para esse estudo de irmãos?

  2. Os dados são um pouco complicados. Entre as 50 famílias, quase 90% delas são gêmeos dizigóticos (DZ). Para as demais famílias,

    1. dois têm apenas um irmão;
    2. dois têm um par DZ mais um irmão; e
    3. dois têm um par DZ mais dois irmãos adicionais.


    Acredito que lmeo pacote R nlmepossa lidar facilmente com (1) com situações ausentes ou desequilibradas. Meu problema é: como lidar com (2) e (3)? Uma possibilidade em que posso pensar é dividir cada uma dessas quatro famílias em (2) e (3) em duas, para que cada subfamília tenha um ou dois irmãos, para que o modelo acima ainda possa ser aplicado. Isso é bom? Outra opção seria simplesmente jogar fora os dados dos um ou dois irmãos extras em (2) e (3), o que parece ser um desperdício. Alguma abordagem melhor?

  3. Parece que lmepermite fixar os valores de na matriz de variância-covariância residual , por exemplo = 0,5. Faz sentido impor a estrutura de correlação ou devo simplesmente estimar com base nos dados?rRr122

pólo azul
fonte
1
O que denota? xj
Macro
@ Macro: Obrigado por descobrir isso. Apenas modificou o OP para indicar que é uma variável explicativa, medida comportamental de cada irmão. xij
Bluepole # 16/12
1
Pergunta e aplicação muito interessante. Eu poderia estar faltando alguma coisa, mas parece-me que este modelo está com excesso de parâmetros. Os erros correlacionados pode efetivamente ser tidos em conta uma um "não partilhado" componente e um componente de "partilhada", o último dos quais tem a mesma função que δ 0 i . Você terá que excluir δ 0 i , cometer erros de ϵ do, ou impor restrições como r 2 12 = 0,5 para identificabilidade - você está fazendo isso de propósito para desacoplar componentes ambientais / genéticos à correlação entre irmãos?ϵi1,ϵi2δ0iδ0iϵr122=.5
Macro
@Macro: Você está certo: não é necessário no modelo. Obrigado por apontar isso! Estranhamente, não se queixa de tal redundância. δ0ilme
bluepole
Você ainda está trabalhando com esse modelo super-paramétrico (essa parte da sua pergunta não foi editada)?
Macro

Respostas:

10

Você pode incluir gêmeos e não gêmeos em um modelo unificado usando uma variável dummy e incluindo inclinações aleatórias nessa variável dummy. Como todas as famílias têm no máximo um conjunto de gêmeos, isso será relativamente simples:

Seja se o irmão j da família i for gêmeo e 0 caso contrário. Suponho que você também queira que a inclinação aleatória seja diferente entre gêmeos e irmãos regulares - se não, não inclua o termo η i 3 no modelo abaixo.Aij=1jiηi3

Em seguida, ajuste o modelo:

yij=α0+α1xij+ηi0+ηi1Aij+ηi2xij+ηi3xijAij+εij
  • são efeitos fixos, como na sua especifiaçãoα0,α1

  • é o efeito aleatório de irmãos da 'linha de base' e η i 1 é o efeito aleatório adicional que permite que os gêmeos sejam mais parecidos que os irmãos comuns. Os tamanhos das variações de efeito aleatório correspondentes quantificam quão irmãos são semelhantes e quanto mais gêmeos são parecidos com os irmãos comuns. Observe que as correlações de gêmeos e não-gêmeos são caracterizadas por este modelo - as correlações de gêmeos são calculadas somando-se os efeitos aleatórios apropriadamente (insira A i j = 1 ).ηi0ηi1Aij=1

  • e η i 3 têm papéis análogos, apenas eles agem como as inclinações aleatórias de x i jηi2ηi3xij

  • εij

Você pode ajustar o modelo usando o Rpacote lme4. No código abaixo, a variável dependente é y, a variável dummy é A, o preditor é x, o produto da variável dummy e o preditor é Axe famIDé o número identificador da família. Presume-se que seus dados sejam armazenados em um quadro de dados D, com essas variáveis ​​como colunas.

library(lme4) 
g <- lmer(y ~ x + (1+A+x+Ax|famID), data=D) 

As variáveis ​​de efeito aleatório e as estimativas de efeitos fixos podem ser visualizadas digitando summary(g). Observe que este modelo permite que os efeitos aleatórios sejam livremente correlacionados entre si.

Em muitos casos, pode fazer mais sentido (ou ser mais facilmente interpretável) assumir a independência entre os efeitos aleatórios (por exemplo, essa suposição costuma ser feita para decompor a correlação familiar genética versus ambiental), caso em que você deve digitar

g <- lmer(y ~ x + (1|famID) + (A-1|famID) + (x-1|famID) +(Ax-1|famID), data=D) 
Macro
fonte
Esta é realmente uma solução agradável, e eu gosto! Irá experimentá-lo em breve, e veja como vai ... Muito obrigado!
bluepole
Seja bem-vindo. Se você encontrou esta solução útil por favor considere aceitar a resposta :)
Macro
Duas questões: 1) Como a maioria dos sujeitos é gêmeos dizigóticos, sua abordagem parece não modelar a correlação entre um par gêmeo DZ. 2) Apenas 4 famílias têm irmãos extras. Estou preocupado que seria difícil estimar os efeitos aleatórios para os irmãos com base apenas nessas quatro famílias. Como a diferença entre um par gêmeo DZ e outro irmão é relativamente pequena (principalmente ambiental, não genética), talvez eu possa simplesmente ignorar a diferença sutil de gêmeo x irmão e tratar esses poucos irmãos como gêmeos, com efeitos aleatórios, como no seu modelo ou com resíduos correlacionados como no meu OP.
Bluepole # 20/12
σ02+σ12σ02+σ12+σε2
σ02,σ12ηi0,ηi1σε2
ηi0ηi2