Eu tenho o seguinte modelo m_plot
equipado com lme4::lmer
efeitos aleatórios cruzados para participantes ( lfdn
) e itens ( content
):
Random effects:
Groups Name Variance Std.Dev. Corr
lfdn (Intercept) 172.173 13.121
role1 62.351 7.896 0.03
inference1 24.640 4.964 0.08 -0.30
inference2 52.366 7.236 -0.05 0.17 -0.83
inference3 21.295 4.615 -0.03 0.22 0.86 -0.77
content (Intercept) 23.872 4.886
role1 2.497 1.580 -1.00
inference1 18.929 4.351 0.52 -0.52
inference2 14.716 3.836 -0.16 0.16 -0.08
inference3 17.782 4.217 -0.17 0.17 0.25 -0.79
role1:inference1 9.041 3.007 0.10 -0.10 -0.10 -0.21 0.16
role1:inference2 5.968 2.443 -0.60 0.60 -0.11 0.78 -0.48 -0.50
role1:inference3 4.420 2.102 0.30 -0.30 0.05 -0.97 0.71 0.37 -0.90
Residual 553.987 23.537
Number of obs: 3480, groups: lfdn, 435 content, 20
Quero conhecer os coeficientes de correlação intraclasse (ICC) para participantes e itens. Graças a essa ótima resposta , em princípio sei como obter o TPI para o meu modelo. No entanto, não tenho certeza se devo incluir ou não as pistas aleatórias:
vars <- lapply(summary(m_plot)$varcor, diag)
resid_var <- attr(summary(m_plot)$varcor, "sc")^2
total_var <- sum(sapply(vars, sum), resid_var)
# with random slopes
sapply(vars, sum)/total_var
## lfdn content
## 0.33822396 0.09880349
# only random intercepts:
sapply(vars, function(x) x[1]) / total_var
## lfdn.(Intercept) content.(Intercept)
## 0.17496587 0.02425948
Qual é a medida apropriada para a correlação entre duas respostas do mesmo participante e do mesmo item?
Respostas:
Basicamente, não há um número único ou estimativa que possa resumir o grau de agrupamento em um modelo de declives aleatórios.
A correlação intra-classe (ICC) só pode ser escrita como uma proporção simples de variações nos modelos de interceptação aleatória. Para ver por que, um esboço da derivação da expressão ICC pode ser encontrado aqui .
Quando você lança inclinações aleatórias na equação do modelo, seguir as mesmas etapas leva à expressão ICC na página 5 deste documento . Como você pode ver, essa expressão complicada é uma função do preditor X. Para ver mais intuitivamente por que var (Y) depende de X quando há inclinações aleatórias, consulte a página 30 desses slides ("Por que a variação depende de x ? ") .
Como o ICC é uma função dos preditores (os valores x), ele só pode ser calculado para conjuntos específicos de valores x. Talvez você possa tentar algo como relatar o ICC na média conjunta dos valores-x, mas essa estimativa será comprovadamente imprecisa para a maioria das observações.
Tudo o que eu disse ainda se refere apenas aos casos em que existe um único fator aleatório. Com vários fatores aleatórios, torna-se ainda mais complicado. Por exemplo, em um projeto de vários locais em que os participantes de cada local respondem a uma amostra de estímulos (ou seja, três fatores aleatórios: local, participante, estímulo), poderíamos perguntar sobre muitos CCIs diferentes: Qual é a correlação esperada entre duas respostas no mesmo local, com o mesmo estímulo, de diferentes participantes? Que tal em locais diferentes, o mesmo estímulo e participantes diferentes? E assim por diante. O @rvl menciona essas complicações na resposta à qual o OP se vinculou.
Portanto, como você pode ver, o único caso em que podemos resumir o grau de agrupamento com um único valor é o caso de fator aleatório único e interceptação aleatória único. Como essa é uma proporção tão pequena de casos do mundo real, os ICCs não são tão úteis na maioria das vezes. Portanto, minha recomendação geral é nem se preocupar com eles. Em vez disso, recomendo apenas relatar os componentes de variação (de preferência no formato de desvio padrão).
fonte