Basicamente, o que eu quero saber é como as diferentes estruturas de covariância são aplicadas e como os valores dentro dessas matrizes são calculados. Funções como lme () permitem escolher qual estrutura gostaríamos, mas eu adoraria saber como elas são estimadas.
Considere o modelo linear de efeitos mistos .
Onde e . Além disso:ϵ d ∼ N ( 0 , R )
Para simplificar, assumiremos .
Basicamente, minha pergunta é: como exatamente é estimado a partir dos dados para as várias parametrizações? Digamos se assumimos que é diagonal (efeitos aleatórios são independentes) ou totalmente parametrizado (caso eu esteja mais interessado no momento) ou alguma das várias outras parametrizações? Existem estimadores / equações simples para estes? (Isso sem dúvida seria estimado iterativamente.)D D
EDIT: Do livro Variance Components (Searle, Casella, McCulloch 2006), consegui ver o seguinte:
Se , os componentes da variação são atualizados e calculados da seguinte forma:
Onde e são os th atualizações respectivamente.
Existem fórmulas gerais quando é diagonal do bloco ou totalmente parametrizado? Suponho que, no caso totalmente parametrizado, uma decomposição de Cholesky é usada para garantir definição e simetria positivas.
Respostas:
O link Goldstein .pdf @probabilityislogic é um ótimo documento. Aqui está uma lista de algumas referências que discutem sua pergunta específica:
Harville, 1976: Extensão do Teorema de Gauss-Markov para incluir a estimativa de efeitos aleatórios .
Harville, 1977: abordagens de máxima verossimilhança para estimativa de componentes de variância e problemas relacionados .
Laird e Ware, 1982: Modelos de efeitos aleatórios para dados longitudinais .
McCulloch, 1997: algoritmos de máxima verossimilhança para modelos mistos lineares generalizados .
O trecho do Guia do Usuário do SAS para o procedimento MIXED possui ótimas informações sobre estimativa de covariância e muitas outras fontes (começando na página 3968).
Existem inúmeros livros didáticos de qualidade sobre análise de dados de medidas longitudinais / repetidas, mas aqui está um que detalha a implementação em R (dos autores de
lme4
enlme
):Pinheiro e Bates, 2000: Modelos de Efeitos Mistos em S e S-PLUS .
EDIT : Mais um artigo relevante: Lindstrom e Bates, 1988: Newton-Raphson e EM Algorithms para modelos lineares de efeitos mistos para dados de medidas repetidas .
EDIT 2 : E outro: Jennrich e Schluchter, 1986: Modelos de Medidas Repetidas Desequilibradas com Matrizes de Covariância Estruturada .
fonte
lme4
e ver como ele lida com essa estimativa.Harvey Goldstein não é um lugar ruim para começar.
Como nos métodos de estimativa mais complexos, varia de acordo com o pacote de software. No entanto, muitas vezes o que é feito é realizado nas seguintes etapas:
Um método simples e rápido é o IGLS, que se baseia na iteração entre dois procedimentos de mínimos quadrados e é descrito em detalhes no capítulo dois. A desvantagem é que ele não funciona bem para componentes de variação próximos de zero.
fonte
O artigo a seguir fornece uma solução de formulário fechado para D:
fonte
mais duas referências que poderiam ser úteis Variance Components por Searle Et al e Lynch e Walsh Genetics and Analysis of Quantitative Traits . O livro de Lynch e Walsh fornece um algoritmo passo a passo, se bem me lembro
fonte