Armadilhas de modelos lineares mistos

18

Quais são algumas das principais armadilhas do uso de modelos lineares de efeitos mistos? Quais são as coisas mais importantes a serem testadas / observadas na avaliação da adequação do seu modelo? Ao comparar modelos do mesmo conjunto de dados, quais são as coisas mais importantes a serem procuradas?

Alan H.
fonte

Respostas:

16

Essa é uma boa pergunta.

Aqui estão algumas armadilhas comuns:

  1. Usando a teoria da verossimilhança padrão, podemos derivar um teste para comparar duas hipóteses aninhadas, e , calculando a estatística do teste da razão de verossimilhança. A distribuição nula desta estatística de teste é aproximadamente qui-quadrado com graus de liberdade iguais à diferença nas dimensões dos dois espaços dos parâmetros. Infelizmente, este teste é apenas aproximado e requer várias suposições. Uma suposição crucial é que os parâmetros sob o valor nulo não estão no limite do espaço de parâmetro. Como muitas vezes estamos interessados ​​em testar hipóteses sobre os efeitos aleatórios que assumem a forma: Essa é uma preocupação real.H0H1

    H0:σ2=0
    A maneira de contornar esse problema é usando o REML. Mas, ainda assim, os valores-p tenderão a ser maiores do que deveriam. Isso significa que, se você observar um efeito significativo usando a aproximação χ2, pode estar bastante confiante de que é realmente significativo. Valores p pequenos, mas não significativos, podem estimular um a usar métodos de inicialização mais precisos, mas demorados.
  2. Comparando Efeitos Fixos: Se você planeja usar o teste da razão de verossimilhança para comparar dois modelos aninhados que diferem apenas em seus efeitos fixos, não poderá usar o método de estimativa REML. O motivo é que o REML estima os efeitos aleatórios considerando combinações lineares dos dados que removem os efeitos fixos. Se esses efeitos fixos forem alterados, as probabilidades dos dois modelos não serão diretamente comparáveis.

  3. Valores-p: os valores-p gerados pelo teste da razão de verossimilhança para efeitos fixos são aproximados e, infelizmente, tendem a ser muito pequenos, exagerando às vezes a importância de alguns efeitos. Podemos usar métodos não paramétricos de inicialização para encontrar valores de p mais precisos para o teste da razão de verossimilhança.

  4. Há outras preocupações sobre os valores de p para o teste de efeitos fixos, destacadas pelo Dr. Doug Bates [ aqui ].

Estou certo de que outros membros do fórum terão melhores respostas.

Fonte: Estendendo modelos lineares com o Dr. Julain Faraway.

suncoolsu
fonte
9

A armadilha comum que vejo é ignorar a variação de efeitos aleatórios. Se for grande em comparação com a variação residual ou a variação da variável dependente, o ajuste geralmente parece bom, mas apenas porque efeitos aleatórios são responsáveis ​​por toda a variação. Mas como o gráfico do real versus o previsto parece bom, você está inclinado a pensar que seu modelo é bom.

Tudo desmorona quando esse modelo é usado para prever novos dados. Normalmente, você pode usar apenas efeitos fixos e o ajuste pode ser muito ruim.

mpiktas
fonte
6

Modelar a estrutura de variação é sem dúvida o recurso mais poderoso e importante dos modelos mistos. Isso se estende além da estrutura de variação para incluir correlação entre as observações. Deve-se tomar cuidado para construir uma estrutura de covariância apropriada, caso contrário, testes de hipóteses, intervalos de confiança e estimativas dos meios de tratamento podem não ser válidos. Frequentemente, é necessário conhecimento do experimento para especificar os efeitos aleatórios corretos.

O SAS para modelos mistos é o meu recurso, mesmo que eu queira fazer a análise em R.

Glen
fonte