Coeficiente de Correlação Intraclasse em modelo misto com inclinações aleatórias

10

Eu tenho o seguinte modelo m_plotequipado com lme4::lmerefeitos aleatórios cruzados para participantes ( lfdn) e itens ( content):

Random effects:
 Groups   Name             Variance Std.Dev. Corr                                     
 lfdn     (Intercept)      172.173  13.121                                            
          role1             62.351   7.896    0.03                                    
          inference1        24.640   4.964    0.08 -0.30                              
          inference2        52.366   7.236   -0.05  0.17 -0.83                        
          inference3        21.295   4.615   -0.03  0.22  0.86 -0.77                  
 content  (Intercept)       23.872   4.886                                            
          role1              2.497   1.580   -1.00                                    
          inference1        18.929   4.351    0.52 -0.52                              
          inference2        14.716   3.836   -0.16  0.16 -0.08                        
          inference3        17.782   4.217   -0.17  0.17  0.25 -0.79                  
          role1:inference1   9.041   3.007    0.10 -0.10 -0.10 -0.21  0.16            
          role1:inference2   5.968   2.443   -0.60  0.60 -0.11  0.78 -0.48 -0.50      
          role1:inference3   4.420   2.102    0.30 -0.30  0.05 -0.97  0.71  0.37 -0.90
 Residual                  553.987  23.537                                            
Number of obs: 3480, groups:  lfdn, 435 content, 20

Quero conhecer os coeficientes de correlação intraclasse (ICC) para participantes e itens. Graças a essa ótima resposta , em princípio sei como obter o TPI para o meu modelo. No entanto, não tenho certeza se devo incluir ou não as pistas aleatórias:

vars <- lapply(summary(m_plot)$varcor, diag)
resid_var <- attr(summary(m_plot)$varcor, "sc")^2
total_var <- sum(sapply(vars, sum), resid_var)

# with random slopes
sapply(vars, sum)/total_var
##       lfdn    content 
## 0.33822396 0.09880349

# only random intercepts:
sapply(vars, function(x) x[1]) / total_var
##   lfdn.(Intercept) content.(Intercept) 
##         0.17496587          0.02425948 

Qual é a medida apropriada para a correlação entre duas respostas do mesmo participante e do mesmo item?

Henrik
fonte
11
Merlo et al 2005 "Um breve tutorial conceitual sobre análise multinível em epidemiologia social: investigando fenômenos contextuais em diferentes grupos de pessoas" pode ser uma referência útil.
N # Brouwer
@Henrik, você já encontrou uma resposta para esta pergunta? Eu também estou interessado.
Patrick S. Forscher
2
@ PatrickS.Forscher Tanto quanto eu entendo, o ICC não faz sentido com pistas aleatórias. Eu aprendi isso com Jake Westfall.
Henrik
Tem um link para uma leitura relevante por acaso?
Patrick S. Forscher
11
@ PatrickS.Forscher Como você pode ver, Jake Westfall agora forneceu uma ótima resposta.
`

Respostas:

8

Basicamente, não há um número único ou estimativa que possa resumir o grau de agrupamento em um modelo de declives aleatórios.

A correlação intra-classe (ICC) só pode ser escrita como uma proporção simples de variações nos modelos de interceptação aleatória. Para ver por que, um esboço da derivação da expressão ICC pode ser encontrado aqui .

Quando você lança inclinações aleatórias na equação do modelo, seguir as mesmas etapas leva à expressão ICC na página 5 deste documento . Como você pode ver, essa expressão complicada é uma função do preditor X. Para ver mais intuitivamente por que var (Y) depende de X quando há inclinações aleatórias, consulte a página 30 desses slides ("Por que a variação depende de x ? ") .

Como o ICC é uma função dos preditores (os valores x), ele só pode ser calculado para conjuntos específicos de valores x. Talvez você possa tentar algo como relatar o ICC na média conjunta dos valores-x, mas essa estimativa será comprovadamente imprecisa para a maioria das observações.

Tudo o que eu disse ainda se refere apenas aos casos em que existe um único fator aleatório. Com vários fatores aleatórios, torna-se ainda mais complicado. Por exemplo, em um projeto de vários locais em que os participantes de cada local respondem a uma amostra de estímulos (ou seja, três fatores aleatórios: local, participante, estímulo), poderíamos perguntar sobre muitos CCIs diferentes: Qual é a correlação esperada entre duas respostas no mesmo local, com o mesmo estímulo, de diferentes participantes? Que tal em locais diferentes, o mesmo estímulo e participantes diferentes? E assim por diante. O @rvl menciona essas complicações na resposta à qual o OP se vinculou.

Portanto, como você pode ver, o único caso em que podemos resumir o grau de agrupamento com um único valor é o caso de fator aleatório único e interceptação aleatória único. Como essa é uma proporção tão pequena de casos do mundo real, os ICCs não são tão úteis na maioria das vezes. Portanto, minha recomendação geral é nem se preocupar com eles. Em vez disso, recomendo apenas relatar os componentes de variação (de preferência no formato de desvio padrão).

Jake Westfall
fonte