Matriz de variância-covariância em lmer

18

Eu sei que uma das vantagens dos modelos mistos é que eles permitem especificar a matriz de variância-covariância para os dados (simetria composta, auto-regressiva, não estruturada etc.). No entanto, a lmerfunção em R não permite uma especificação fácil dessa matriz. Alguém sabe qual estrutura lmerusa por padrão e por que não há como especificá-la facilmente?

Nikita Kuznetsov
fonte

Respostas:

9

Modelos mistos são (versões generalizadas) de modelos de componentes de variação. Você anota a parte de efeitos fixos, adiciona termos de erro que podem ser comuns para alguns grupos de observações, adiciona a função de link, se necessário, e coloca isso em um maximizador de probabilidade.

As várias estruturas de variação que você está descrevendo, no entanto, são os modelos de correlação de trabalho para as equações de estimativa generalizada, que compensam parte da flexibilidade dos modelos misto / multinível para robustez de inferência. Com os GEEs, você está interessado apenas em realizar inferência na peça fixa e não está autorizado a estimar os componentes de variação, como faria em um modelo misto. Para esses efeitos fixos, você obtém uma estimativa robusta / sanduíche que é apropriada mesmo quando sua estrutura de correlação é especificada incorretamente. A inferência para o modelo misto será quebrada se o modelo for especificado incorretamente.

Portanto, apesar de ter muito em comum (uma estrutura multinível e capacidade de lidar com correlações residuais), modelos mistos e GEEs ainda são procedimentos um tanto distintos. O pacote R que lida com GEEs é chamado apropriadamente geee, na lista de possíveis valores da corstropção, você encontrará as estruturas mencionadas.

Do ponto de vista dos GEEs, lmertrabalha com correlações intercambiáveis ​​... pelo menos quando o modelo possui dois níveis de hierarquia e somente interceptações aleatórias são especificadas.

StasK
fonte
Obrigado Stas. Eu nunca tinha ouvido falar de GEEs antes e apenas tentando aprender modelagem mista (o que é complicado e também é amplificado pelas diferenças na implementação de software). Vou tentar o GEE. Realmente tenho um experimento simples com medidas repetidas com medidas dependentes biomédicas. Estou interessado na parte fixa principalmente. Meu treinamento anterior é principalmente em ANOVAs de efeitos fixos padrão, portanto pode ser uma transição mais fácil.
Nikita Kuznetsov
Eu gosto da idéia de estimar os parâmetros fixos e tentei a biblioteca gee. Existem outras bibliotecas também (geepack, por exemplo). Eles são piores por algum motivo? No meu campo, as pessoas precisam relatar valores-p. Existe uma maneira de obtê-los a partir das estimativas e também realizar comparações aos pares levando em consideração o agrupamento?
Nikita Kuznetsov
Comparações pareadas de quê? A variedade de bibliotecas R sempre me deixou louco, e eu não pesquiso as diferenças entre pacotes, a menos que eu tenha uma necessidade real de trabalhar em um modelo específico.
0000 StasK
StatsK, isso está realmente correto? Sou iniciante em modelagem multinível, mas Hox (2010) ou Rabe-Hesketh & Skrondal (2013) distinguem claramente entre diferentes estimadores de variância via MLE e GEE. Por exemplo, ao calcular o erro padrão sanduíche “robusto”, Hox (p. 260) diz que você pode calculá-los via modelagem multinível usando a matriz Information / inversa da matriz Hessian (levando em consideração a estrutura multinível) ou estimando a variação de resíduos crus e usando GLS depois para calcular os coeficientes (abordagem GEE)
Arne Jonas Warnke
1
Não sei se a distinção sugerida pelo StasK está realmente correta aqui. Embora essas estruturas de correlação alternativas sejam realmente usadas por GEEs, é perfeitamente possível ajustar modelos mistos (totalmente paramétricos) com estruturas mais complicadas para a covariância de efeitos aleatórios ou erros residuais, e o pacote nlme no R, SAS Proc Mixed ou Os comandos mistos do Stata fazem isso.
Jonathan Bartlett
4

A ramificação FlexLamba do lmer fornece essa funcionalidade.

Consulte https://github.com/lme4/lme4/issues/224 para obter exemplos de como implementar uma estrutura específica de erros ou efeitos aleatórios.

majestade
fonte
Posso ter as filiais regulares e FlexLambda instaladas de uma só vez ?. Quão?
skan 19/09/2015
3

Que eu saiba, não é uma maneira "fácil" de resolver isso. Também considerando que, na maioria dos casos, o lmer faz uso pesado de matrizes esparsas para a fatoração de Cholesky, seria improvável que ele permitisse VCVs totalmente não estruturados.

(1|RandEff1)+(1|RandEff2)

R=[σRE120 00 00 00 00 00 0σRE120 00 00 00 00 00 0σRE120 00 00 00 00 00 0σRE220 00 00 00 00 00 0σRE220 00 00 00 00 00 0σRE22]

Porém, nem tudo se perde com as LME: você pode especificar esses atributos da matriz VCV "facilmente" se estiver usando o pacote R MCMCglmm. Veja o CourseNotes.pdf , p.70 . Nessa página, ele fornece alguns análogos sobre como a estrutura de efeitos aleatórios do lme4 seria definida, mas como você se verá, o lmer é menos flexível que o MCMCglmm nesse assunto.

No meio do caminho, há as classes lme corStruct do problema nlme, por exemplo. corCompSymm , corAR1 , etc. etc. A resposta de Fabian neste passo fornece alguns exemplos mais concisos para a especificação VCV baseada em lme4, mas conforme mencionado anteriormente, eles não são tão explicitamente quanto os de MCMCglmm ou nlme.

usεr11852 diz Reinstate Monic
fonte
Não "confio" no MCMCglmm, devido à ingênua escolha de distribuições anteriores.
Stéphane Laurent
R. Eu não acho que seja "ingênuo"; eles podem refletir suposições válidas. Você pode até definir antecedentes impróprios se sentir isso fortemente por alguma coisa. B. Isso foi apenas parte da minha resposta, não disse que é o único caminho a percorrer; Dei exemplo para lme4. C. Se você precisar fazer efeitos mistos multivariados, é praticamente o único pacote disponível junto com o sabreR ...
usεr11852 diz Reinstate Monic
Desculpe, meu comentário não foi uma crítica à sua resposta. Ao dizer "priores ingênuos", falei sobre os priores não informativos.
Stéphane Laurent
Não parece provável que esta matriz R esteja correta. Até a ANOVA de medidas repetidas "clássica" permite correlações diferentes de zero entre as condições (estou pensando na matriz de simetria composta). Parece-me que essa matriz seria válida apenas para um design entre sujeitos com atribuição aleatória com dois clusters.
Nikita Kuznetsov
(1|RumandEff1)+(1|RumandEff2)