Suponhamos que tem alguns alguma variável resposta que foi medido a partir de th irmão em th família. Além disso, alguns dados comportamentais foram coletados ao mesmo tempo de cada sujeito. Estou tentando analisar a situação com o seguinte modelo linear de efeitos mistos:
onde e são a interceptação e a inclinação fixas, respectivamente, é a inclinação aleatória e é o resíduo.
As suposições para os efeitos aleatórios e residual são (supondo que haja apenas dois irmãos em cada família)
onde é um parâmetro de variância desconhecido e a estrutura de variância-covariância R é uma matriz simétrica 2 x 2 da forma
que modela a correlação entre os dois irmãos.
Esse é um modelo apropriado para esse estudo de irmãos?
Os dados são um pouco complicados. Entre as 50 famílias, quase 90% delas são gêmeos dizigóticos (DZ). Para as demais famílias,
- dois têm apenas um irmão;
- dois têm um par DZ mais um irmão; e
- dois têm um par DZ mais dois irmãos adicionais.
Acredito que
lme
o pacote Rnlme
possa lidar facilmente com (1) com situações ausentes ou desequilibradas. Meu problema é: como lidar com (2) e (3)? Uma possibilidade em que posso pensar é dividir cada uma dessas quatro famílias em (2) e (3) em duas, para que cada subfamília tenha um ou dois irmãos, para que o modelo acima ainda possa ser aplicado. Isso é bom? Outra opção seria simplesmente jogar fora os dados dos um ou dois irmãos extras em (2) e (3), o que parece ser um desperdício. Alguma abordagem melhor?Parece que
lme
permite fixar os valores de na matriz de variância-covariância residual , por exemplo = 0,5. Faz sentido impor a estrutura de correlação ou devo simplesmente estimar com base nos dados?
lme
Respostas:
Você pode incluir gêmeos e não gêmeos em um modelo unificado usando uma variável dummy e incluindo inclinações aleatórias nessa variável dummy. Como todas as famílias têm no máximo um conjunto de gêmeos, isso será relativamente simples:
Seja se o irmão j da família i for gêmeo e 0 caso contrário. Suponho que você também queira que a inclinação aleatória seja diferente entre gêmeos e irmãos regulares - se não, não inclua o termo η i 3 no modelo abaixo.Aij=1 j i ηi3
Em seguida, ajuste o modelo:
são efeitos fixos, como na sua especifiaçãoα0,α1
é o efeito aleatório de irmãos da 'linha de base' e η i 1 é o efeito aleatório adicional que permite que os gêmeos sejam mais parecidos que os irmãos comuns. Os tamanhos das variações de efeito aleatório correspondentes quantificam quão irmãos são semelhantes e quanto mais gêmeos são parecidos com os irmãos comuns. Observe que as correlações de gêmeos e não-gêmeos são caracterizadas por este modelo - as correlações de gêmeos são calculadas somando-se os efeitos aleatórios apropriadamente (insira A i j = 1 ).ηi0 ηi1 Aij=1
e η i 3 têm papéis análogos, apenas eles agem como as inclinações aleatórias de x i jηi2 ηi3 xij
Você pode ajustar o modelo usando o
R
pacotelme4
. No código abaixo, a variável dependente éy
, a variável dummy éA
, o preditor éx
, o produto da variável dummy e o preditor éAx
efamID
é o número identificador da família. Presume-se que seus dados sejam armazenados em um quadro de dadosD
, com essas variáveis como colunas.As variáveis de efeito aleatório e as estimativas de efeitos fixos podem ser visualizadas digitando
summary(g)
. Observe que este modelo permite que os efeitos aleatórios sejam livremente correlacionados entre si.Em muitos casos, pode fazer mais sentido (ou ser mais facilmente interpretável) assumir a independência entre os efeitos aleatórios (por exemplo, essa suposição costuma ser feita para decompor a correlação familiar genética versus ambiental), caso em que você deve digitar
fonte