Dada uma variável prevista (P), um efeito aleatório (R) e um efeito fixo (F), pode-se ajustar dois * modelos de efeitos mistos ( sintaxe lme4 ):
m1 = lmer( P ~ (1|R) + F )
m2 = lmer( P ~ (1+F|R) + F)
Pelo que entendi, o segundo modelo é aquele que permite que o efeito fixo varie entre os níveis do efeito aleatório.
Em minha pesquisa, normalmente uso modelos de efeitos mistos para analisar dados de experimentos realizados em vários participantes humanos. Eu modelo participante como efeito aleatório e manipulações experimentais como efeitos fixos. Eu acho que faz sentido a priori permitir que o grau em que os efeitos fixos afetem o desempenho no experimento varie entre os participantes. No entanto, tenho problemas para imaginar circunstâncias em que não devo permitir que os efeitos fixos variem nos níveis de um efeito aleatório, portanto, minha pergunta é:
Quando não se deve permitir que um efeito fixo varie entre os níveis de um efeito aleatório?
fonte
Respostas:
Não sou especialista em modelagem de efeitos mistos, mas a pergunta é muito mais fácil de responder se ela for reformulada no contexto da modelagem de regressão hierárquica. Portanto, nossas observações têm dois índices e F i j com o índice iPij Fij i representando a classe membros da classe. Os modelos hierárquicos permitem ajustar a regressão linear, onde os coeficientes variam entre as classes:j
Esta é a nossa regressão de primeiro nível. A regressão de segundo nível é feita nos primeiros coeficientes de regressão:
quando substituímos isso na regressão de primeiro nível, obtemos
Aqui são efeitos fixos e u são efeitos aleatórios. Modelo misto estima γ e variâncias de u .γ u γ u
O modelo que escrevi corresponde à
lmer
sintaxeAgora, se colocarmos sem o termo aleatório, obtemosβ1i=γ01
que corresponde à
lmer
sintaxePortanto, a questão agora é quando podemos excluir o termo de erro da regressão de segundo nível? A resposta canônica é que, quando temos certeza de que os regressores (aqui não temos nenhum, mas podemos incluí-los, eles naturalmente são constantes nas classes) na regressão de segundo nível, explicamos completamente a variação dos coeficientes entre as classes.
Portanto, neste caso em particular, se o coeficiente de não variar, ou alternativamente a variação de u 1 iFij u1i é muito pequena, devemos ter a ideia de que provavelmente somos melhores no primeiro modelo.
Nota . Eu só dei explicações algébricas, mas acho que, tendo isso em mente, é muito mais fácil pensar em um exemplo aplicado particular.
fonte
Você pode pensar em um "efeito fixo" como um "efeito aleatório" com um componente de variação zero.
Portanto, uma resposta simples para o motivo de você não permitir que o efeito fixo varie é evidência insuficiente para um componente de variação "grande o suficiente". A evidência deve vir das informações anteriores e dos dados. Isso está de acordo com o princípio básico do "occam's razor": não torne seu modelo mais complexo do que o necessário.
Tendo a pensar em modelos mistos lineares da seguinte maneira, escreva uma regressão múltipla da seguinte maneira:
Portanto, a parte "aleatória" do modelo pode ser vista como uma maneira de especificar informações anteriores sobre a estrutura de correlação do componente de ruído ou erro no modelo. O OLS pressupõe basicamente que qualquer erro da parte fixa do modelo em um caso é inútil para prever qualquer outro erro, mesmo se conhecêssemos a parte fixa do modelo com certeza. Adicionar um efeito aleatório significa basicamente que você acha que alguns erros provavelmente serão úteis na previsão de outros erros.
fonte
Essa é uma pergunta bastante antiga, com algumas respostas muito boas, mas acho que ela pode se beneficiar de uma nova resposta para abordar uma perspectiva mais pragmática.
Não irei abordar as questões já descritas nas outras respostas; em vez disso, vou me referir ao agora famoso, embora prefiro dizer um artigo "infame" de Barr et al (2013), frequentemente chamado de "Mantenha-o máximo".
Barr, DJ, Levy, R., Scheepers, C. e Tily, HJ, 2013. Estrutura de efeitos aleatórios para teste de hipótese confirmatória: Mantenha-o máximo. Journal of memory and language, 68 (3), pp.255-278.
Neste artigo, os autores argumentam que todos os efeitos fixos devem variar entre os níveis dos fatores de agrupamento (interceptações aleatórias). O argumento deles é bastante convincente - basicamente, ao não permitir que eles variem, está impondo restrições ao modelo. Isso está bem descrito nas outras respostas. No entanto, existem problemas potencialmente graves com essa abordagem, descritos por Bates el al (2015):
Bates, D., Kliegl, R., Vasishth, S. e Baayen, H., 2015. Modelos mistos parcimoniosos. pré-impressão do arXiv arXiv: 1506.04967
Vale a pena notar aqui que Bates é o principal autor do
lme4
pacote para a montagem de modelos mistos em R, que é provavelmente o pacote mais usado para esses modelos. Bates et al. Observam que em muitas aplicações do mundo real, os dados simplesmente não suportam uma estrutura máxima de efeitos aleatórios, geralmente porque há um número insuficiente de observações em cada cluster para as variáveis relevantes. Isso pode se manifestar em modelos que não convergem ou são singulares nos efeitos aleatórios. O grande número de perguntas neste site sobre esses modelos atesta isso. Eles também observam que Barr et al usaram uma simulação relativamente simples, com efeitos aleatórios "bem comportados" como base para o trabalho. Em vez disso, Bates et al sugerem a seguinte abordagem:No mesmo artigo, eles também observam:
E:
Bates et al. (2015)
De uma perspectiva mais aplicada, uma consideração adicional que deve ser feita é se o processo de geração de dados, a teoria biológica / física / química subjacente aos dados, deve orientar o analista na especificação da estrutura de efeitos aleatórios.
fonte