Especificação de efeito aleatório no modelo de efeito misto mais recente
8
Qual é a diferença entre (1|DNA.concentration/mouse.id)e (DNA.concentration|mouse.id)? O que significam os símbolos |e /significam dentro da sintaxe para o efeito aleatório?
o que faz o símbolo "|" e "/" significa em fator aleatório?
Yating Li
@gung A questão não está em conformidade com as regras do site. O OP deve conter alguns antecedentes sobre o que eles estão tentando fazer. No entanto, acho que eles estão pedindo a diferença na sintaxe entre "/" e "|". Talvez o título do post deva refletir isso. Essa seria uma pergunta válida?
Eu não acho que a questão ligada é uma duplicata adequada ... ele fala (1|a/b), mas não para a distinção entre (1|a/b)e (b|a)...
Ben Bolker
Respostas:
14
Se você possui dois fatores categóricosf e g, em seguida, (1|f/g)expande para (1|f) + (1|f:g), isto é, variação na interceptação (que fica 1no lado esquerdo da barra) entre os níveis de fe entre os níveis de f:g(a interação entre fe g). Isso também é chamado de efeito aleatório de ganinhado dentrof (a ordem é importante aqui). Essa é a maneira tradicional de combinar dois fatores aleatórios em um modelo clássico de ANOVA, porque nessa estrutura os efeitos aleatórios devem ser aninhados (ou seja, festá aninhado dentro gou ganinhado f). (Consulte http://glmm.wikidot.com/faqpara obter mais informações sobre fatores aninhados.) Este modelo estima dois parâmetros, por exemplo, e , não importa quantos níveis cada variável categórica tenha. Seria um modelo típico para um design aninhado . σ 2 f : gσ2fσ2f:g
Por outro lado, (f|g)especifica que os efeitos de fvariam entre os níveis de g: por exemplo, se fé uma variável categórica de dois níveis com os níveis "controle" e "tratamento", esse modelo especifica que estamos permitindo a interceptação (resposta de controle) e o efeito do tratamento (diferença entre as respostas de controle e tratamento) varia entre os níveis de g. Cada efeito tem sua própria variação e, por padrão, lme4combina covariâncias entre cada um dos parâmetros. Este modelo estimaria os parâmetros , e , onde o último se refere à covariância entre os efeitos de controle e tratamento. Se tiver σ 2 g , t σ g , c ⋅ t f n n ( n + 1 ) / 2σ2g,cσ2g,tσg,c⋅tfn níveis, este modelo estima parâmetros; é mais apropriado para um delineamento em blocos ao acaso, onde cada tratamento é repetido em cada bloco.n(n+1)/2
Se ftiver muitos níveis, a última (f|g)) especificação de modelo pode implicar modelos com muitos parâmetros; Há um debate em andamento (veja, por exemplo, este artigo do ArXiv ) sobre a melhor maneira de lidar com essa situação.
Se, em vez disso, considerarmos (x|g)onde xé uma variável de entrada contínua (numérica), o termo especifica um modelo de pistas aleatórias; a interceptação (implicitamente) e a inclinação em relação a xambos variam entre os níveis de g(um termo de covariância também é adequado).
Nesse caso, (g|x)não faria sentido - o termo no lado direito da barra é uma variável de agrupamento e sempre é interpretado como categórico. O único caso em que isso poderia fazer sentido é em um design xcontínuo, mas várias observações foram feitas em cada nível e em que você deseja tratar xcomo uma variável categórica para fins de modelagem.
(1|a/b)
, mas não para a distinção entre(1|a/b)
e(b|a)
...Respostas:
Se você possui dois fatores categóricosσ2f σ2f:g
f
eg
, em seguida,(1|f/g)
expande para(1|f) + (1|f:g)
, isto é, variação na interceptação (que fica1
no lado esquerdo da barra) entre os níveis def
e entre os níveis def:g
(a interação entref
eg
). Isso também é chamado de efeito aleatório deg
aninhado dentrof
(a ordem é importante aqui). Essa é a maneira tradicional de combinar dois fatores aleatórios em um modelo clássico de ANOVA, porque nessa estrutura os efeitos aleatórios devem ser aninhados (ou seja,f
está aninhado dentrog
oug
aninhadof
). (Consulte http://glmm.wikidot.com/faqpara obter mais informações sobre fatores aninhados.) Este modelo estima dois parâmetros, por exemplo, e , não importa quantos níveis cada variável categórica tenha. Seria um modelo típico para um design aninhado . σ 2 f : gPor outro lado,σ2g,c σ2g,t σg,c⋅t f n níveis, este modelo estima parâmetros; é mais apropriado para um delineamento em blocos ao acaso, onde cada tratamento é repetido em cada bloco.n(n+1)/2
(f|g)
especifica que os efeitos def
variam entre os níveis deg
: por exemplo, sef
é uma variável categórica de dois níveis com os níveis "controle" e "tratamento", esse modelo especifica que estamos permitindo a interceptação (resposta de controle) e o efeito do tratamento (diferença entre as respostas de controle e tratamento) varia entre os níveis deg
. Cada efeito tem sua própria variação e, por padrão,lme4
combina covariâncias entre cada um dos parâmetros. Este modelo estimaria os parâmetros , e , onde o último se refere à covariância entre os efeitos de controle e tratamento. Se tiver σ 2 g , t σ g , c ⋅ t f n n ( n + 1 ) / 2Se
f
tiver muitos níveis, a última(f|g)
) especificação de modelo pode implicar modelos com muitos parâmetros; Há um debate em andamento (veja, por exemplo, este artigo do ArXiv ) sobre a melhor maneira de lidar com essa situação.Se, em vez disso, considerarmos
(x|g)
ondex
é uma variável de entrada contínua (numérica), o termo especifica um modelo de pistas aleatórias; a interceptação (implicitamente) e a inclinação em relação ax
ambos variam entre os níveis deg
(um termo de covariância também é adequado).Nesse caso,
(g|x)
não faria sentido - o termo no lado direito da barra é uma variável de agrupamento e sempre é interpretado como categórico. O único caso em que isso poderia fazer sentido é em um designx
contínuo, mas várias observações foram feitas em cada nível e em que você deseja tratarx
como uma variável categórica para fins de modelagem.fonte