Na prática, como é calculada a matriz de covariância de efeitos aleatórios em um modelo de efeitos mistos?

19

Basicamente, o que eu quero saber é como as diferentes estruturas de covariância são aplicadas e como os valores dentro dessas matrizes são calculados. Funções como lme () permitem escolher qual estrutura gostaríamos, mas eu adoraria saber como elas são estimadas.

Considere o modelo linear de efeitos mistos .Y=Xβ+Zu+ϵ

Onde e . Além disso:ϵ d N ( 0 , R )udN(0,D)ϵdN(0,R)

Var(Y|X,Z,β,u)=R

Var(Y|X,β)=ZDZ+R=V

Para simplificar, assumiremos .R=σ2In

Basicamente, minha pergunta é: como exatamente é estimado a partir dos dados para as várias parametrizações? Digamos se assumimos que é diagonal (efeitos aleatórios são independentes) ou totalmente parametrizado (caso eu esteja mais interessado no momento) ou alguma das várias outras parametrizações? Existem estimadores / equações simples para estes? (Isso sem dúvida seria estimado iterativamente.)D DDDD

EDIT: Do livro Variance Components (Searle, Casella, McCulloch 2006), consegui ver o seguinte:

Se , os componentes da variação são atualizados e calculados da seguinte forma:D=σu2Iq

σu2(k+1)=u^Tu^σu2(k)trace(V1ZTZ)

σe2(k+1)=Y(YXβ^(k)Zu^(k))/n

Onde e são os th atualizações respectivamente.β^(k)u^(k)k

Existem fórmulas gerais quando é diagonal do bloco ou totalmente parametrizado? Suponho que, no caso totalmente parametrizado, uma decomposição de Cholesky é usada para garantir definição e simetria positivas.D

dcl
fonte
2
arxiv.org/pdf/1406.5823 (no prelo no Journal of Statistical Software ) pode ser útil ...
Ben Bolker

Respostas:

8

O link Goldstein .pdf @probabilityislogic é um ótimo documento. Aqui está uma lista de algumas referências que discutem sua pergunta específica:

Harville, 1976: Extensão do Teorema de Gauss-Markov para incluir a estimativa de efeitos aleatórios .

Harville, 1977: abordagens de máxima verossimilhança para estimativa de componentes de variância e problemas relacionados .

Laird e Ware, 1982: Modelos de efeitos aleatórios para dados longitudinais .

McCulloch, 1997: algoritmos de máxima verossimilhança para modelos mistos lineares generalizados .

O trecho do Guia do Usuário do SAS para o procedimento MIXED possui ótimas informações sobre estimativa de covariância e muitas outras fontes (começando na página 3968).

Existem inúmeros livros didáticos de qualidade sobre análise de dados de medidas longitudinais / repetidas, mas aqui está um que detalha a implementação em R (dos autores de lme4e nlme):

Pinheiro e Bates, 2000: Modelos de Efeitos Mistos em S e S-PLUS .

EDIT : Mais um artigo relevante: Lindstrom e Bates, 1988: Newton-Raphson e EM Algorithms para modelos lineares de efeitos mistos para dados de medidas repetidas .

EDIT 2 : E outro: Jennrich e Schluchter, 1986: Modelos de Medidas Repetidas Desequilibradas com Matrizes de Covariância Estruturada .


fonte
Eu dei uma olhada em Pinheiro e Bates, especificamente no Capítulo 2 (sobre teoria e computação), mas não pareceu cintilar nada sobre como a estrutura de covariância é imposta e estimada? Vou repassar isso em breve. Eu tenho alguns desses papéis aqui, definitivamente vou ter que lê-los novamente. Felicidades.
dcl 30/11
1
@dcl Analisando o Capítulo 2 da P&B, vejo que eles podem estar encobrindo algumas das etapas em que você está interessado (elas mencionam a otimização da probabilidade de log através dos parâmetros de covariância, mas não dizem como ). Dito isto, a Seção 2.2.8 pode ser a seção que melhor responde à sua pergunta.
1
@dcl Adicionada mais uma fonte que pode ajudar.
obrigado pelos links. Eu já dei uma olhada nesses documentos no passado, alguns deles são bastante técnicos para mim. Vou dar uma outra olhada neles agora, mas à primeira vista não consigo obter o que quero deles.
dcl 30/11
1
@dcl Desculpe pela parede de links, mas sua pergunta é sobre a qual uma pessoa pode passar algumas palestras completas discutindo (é uma pergunta muito boa que é meio que varrida para debaixo do tapete quando você aprende sobre modelos de efeitos mistos). Além de examinar a literatura, uma coisa que você pode fazer é procurar o código-fonte lme4e ver como ele lida com essa estimativa.
7

Harvey Goldstein não é um lugar ruim para começar.

Como nos métodos de estimativa mais complexos, varia de acordo com o pacote de software. No entanto, muitas vezes o que é feito é realizado nas seguintes etapas:

  1. Escolha um valor inicial para (diga D 0 ) e R (diga R 0 ). Defina i = 1DD0RR0i=1
  2. D=Di1R=Ri1βuϵβiuiϵi
  3. β=βiu=uiϵ=ϵiDRDiRi
  4. i=i+1

Um método simples e rápido é o IGLS, que se baseia na iteração entre dois procedimentos de mínimos quadrados e é descrito em detalhes no capítulo dois. A desvantagem é que ele não funciona bem para componentes de variação próximos de zero.

probabilityislogic
fonte
Eu sei que esse é o método geral, mas como são estimadas D e R, que equações são usadas para as várias estruturas? Quais são os bons valores iniciais? Vou verificar o pdf agora, felicidades.
DCL