Cálculo da repetibilidade dos efeitos de um modelo mais antigo

28

Acabei de me deparar com este artigo , que descreve como calcular a repetibilidade (também conhecida como confiabilidade, também conhecida como correlação intraclasse) de uma medição via modelagem de efeitos mistos. O código R seria:

#fit the model
fit = lmer(dv~(1|unit),data=my_data)

#obtain the variance estimates
vc = VarCorr(fit)
residual_var = attr(vc,'sc')^2
intercept_var = attr(vc$id,'stddev')[1]^2

#compute the unadjusted repeatability
R = intercept_var/(intercept_var+residual_var)

#compute n0, the repeatability adjustment
n = as.data.frame(table(my_data$unit))
    k = nrow(n)
    N = sum(n$Freq)
n0 = (N-(sum(n$Freq^2)/N))/(k-1)

#compute the adjusted repeatability
Rn = R/(R+(1-R)/n0)

Acredito que essa abordagem também possa ser usada para calcular a confiabilidade dos efeitos (isto é, o efeito de contraste da soma de uma variável com 2 níveis), como em:

#make sure the effect variable has sum contrasts
contrasts(my_data$iv) = contr.sum

#fit the model
fit = lmer(dv~(iv|unit)+iv,data=my_data)

#obtain the variance estimates
vc = VarCorr(fit)
residual_var = attr(vc,'sc')^2
effect_var = attr(vc$id,'stddev')[2]^2

#compute the unadjusted repeatability
R = effect_var/(effect_var+residual_var)

#compute n0, the repeatability adjustment
n = as.data.frame(table(my_data$unit,my_data$iv))
k = nrow(n)
N = sum(n$Freq)
    n0 = (N-(sum(n$Freq^2)/N))/(k-1)

#compute the adjusted repeatability
Rn = R/(R+(1-R)/n0)

Três perguntas:

  1. Os cálculos acima para obter a estimativa pontual da repetibilidade de um efeito fazem sentido?
  2. Quando tenho várias variáveis ​​cuja repetibilidade quero estimar, adicioná-las todas ao mesmo ajuste (por exemplo lmer(dv~(iv1+iv2|unit)+iv1+iv2) parece produzir estimativas de repetibilidade mais altas do que criar um modelo separado para cada efeito. Isso faz sentido computacionalmente para mim, pois a inclusão de múltiplos efeitos tende a diminuir a variação residual, mas não tenho certeza de que as estimativas de repetibilidade resultantes sejam válidas. São eles?
  3. O artigo citado acima sugere que o perfil de probabilidade pode me ajudar a obter intervalos de confiança para as estimativas de repetibilidade, mas, tanto quanto posso dizer, confint(profile(fit))fornece apenas intervalos para as variações de interceptação e efeito, enquanto eu precisaria adicionalmente do intervalo para calcular a variação residual o intervalo para a repetibilidade, não?
Mike Lawrence
fonte

Respostas:

6

Eu acho que posso responder suas perguntas pelo menos a respeito das estimativas de repetibilidade não ajustadas , ou seja, as correlações intraclasses (ICCs) clássicas. Quanto às estimativas de repetibilidade "ajustadas", passei os olhos pelo artigo que você vinculou e realmente não vi onde a fórmula aplicada pode ser encontrada no artigo? Com base na expressão matemática, parece ser a repetibilidade das pontuações médias (em vez das pontuações individuais). Mas não está claro se essa é uma parte crítica da sua pergunta, então eu a ignorarei.

(1.) Os cálculos acima para obter a estimativa pontual da repetibilidade de um efeito fazem sentido?

Sim, a expressão que você propõe faz sentido, mas é necessária uma pequena modificação na fórmula proposta. Abaixo, mostro como é possível derivar o coeficiente de repetibilidade proposto. Espero que isso esclareça o significado conceitual do coeficiente e também mostre por que seria desejável modificá-lo um pouco.

Para começar, vamos primeiro pegar o coeficiente de repetibilidade no seu primeiro caso e esclarecer o que significa e de onde vem. Compreender isso nos ajudará a entender o segundo caso mais complicado.

Apenas interceptações aleatórias

Neste caso, o modelo de mistura para a th resposta no j th grupo é y i j = β 0 + U 0 j + e i j , onde as intercepções aleatórios u 0 j possui variância σ 2 u 0 e os resíduos de e i j tem variância σ 2 e .Euj

yEuj=β0 0+você0 0j+eEuj,
você0 0jσvocê0 02eEujσe2

Agora, a correlação entre duas variáveis ​​aleatórias e y é definida como c o r r = c o v ( x , y )xy

corr=cov(x,y)vumar(x)vumar(y).

A expressão para o coeficiente de ICC / repetibilidade, em seguida, trata de deixar as duas variáveis aleatórias e y ser duas observações retirados do mesmo j grupo, I C C = C O v ( β 0 + U 0 j + e i 1 j , p 0 + u 0 j + e i 2 j )xyj e se você simplificar isso usando as definições dadas acima e as propriedades das variações / covariâncias (um processo que não mostrarei aqui, a menos que você ou outras pessoas prefiram que eu fiz), você termina com ICC=σ 2 u 0

EuCC=cov(β0 0+você0 0j+eEu1j,β0 0+você0 0j+eEu2j)vumar(β0 0+você0 0j+eEu1j)vumar(β0 0+você0 0j+eEu2j),
O que isso significa é que o ICC ou "coeficiente de repetibilidade não ajustado", neste caso, tem uma interpretação simples como a correlação esperada entre as observações de um par do mesmo cluster (líquido dos efeitos fixos, que neste caso é apenas a grande média). O fato de o TPI também ser interpretável como umaproporção de variaçãoneste caso é coincidente; essa interpretação não é verdadeira em geral para ICCs mais complicados. A interpretação como algum tipo de correlação é o principal.
EuCC=σvocê0 02σvocê0 02+σe2.

Interceptações aleatórias e inclinações aleatórias

Agora, para o segundo caso, precisamos primeiro esclarecer o que exatamente se entende por "a confiabilidade dos efeitos (isto é, o efeito da soma do contraste de uma variável com 2 níveis)" - suas palavras.

Eujkx

yEujk=β0 0+β1xk+você0 0j+você1jxk+eEujk,
σvocê0 02σvocê12σvocê01eEujσe2

jEu

x|x1|=|x2|=x

yEu1jk2-yEu1jk1=(β0 0-β0 0)+β1(xk2-xk1)+(você0 0j-você0 0j)+você1j(xk2-xk1)+(eEu1jk2-eEu1jk1)=2xβ1+2xvocê1j+eEu1jk2-eEu1jk1
yEu2jk2-yEu2jk1=2xβ1+2xvocê1j+eEu2jk2-eEu2jk1.

Plugging these into the correlation formula gives us

EuCC=cov(2xβ1+2xvocê1j+eEu1jk2-eEu1jk1,2xβ1+2xvocê1j+eEu2jk2-eEu2jk1)vumar(2xβ1+2xvocê1j+eEu1jk2-eEu1jk1)vumar(2xβ1+2xvocê1j+eEu2jk2-eEu2jk1),
o que simplifica até
EuCC=2x2σvocê122x2σvocê12+σe2.
Observe que o TPI é tecnicamente uma função de x! No entanto, neste casox pode levar apenas 2 valores possíveis e o ICC é idêntico em ambos os valores.

Como você pode ver, isso é muito semelhante ao coeficiente de repetibilidade que você propôs na sua pergunta, a única diferença é que a variação aleatória da inclinação deve ser adequadamente dimensionada para que a expressão seja interpretada como um ICC ou "coeficiente de repetibilidade não ajustado". A expressão que você escreveu funciona no caso especial em que ox preditor é codificado ±12, mas não em geral.

(2.) Quando eu tenho várias variáveis ​​cuja repetibilidade eu quero estimar, adicioná-las todas ao mesmo ajuste (por exemplo lmer(dv~(iv1+iv2|unit)+iv1+iv2) parece produzir estimativas de repetibilidade mais altas do que criar um modelo separado para cada efeito. Isso faz sentido computacionalmente para mim, pois a inclusão de múltiplos efeitos tende a diminuir a variação residual, mas não tenho certeza de que as estimativas de repetibilidade resultantes sejam válidas. São eles?

Acredito que trabalhar com uma derivação semelhante à apresentada acima para um modelo com múltiplos preditores com suas próprias inclinações aleatórias mostraria que o coeficiente de repetibilidade acima ainda seria válido, exceto pela complicação adicional de que as pontuações de diferença em que estamos conceitualmente interessados ​​agora temos uma definição ligeiramente diferente: a saber, estamos interessados ​​na correlação esperada das diferenças entre médias ajustadas após o controle para os outros preditores do modelo.

Se os outros preditores forem ortogonais ao preditor de interesse (como em, por exemplo, um experimento equilibrado), eu pensaria que o coeficiente ICC / repetibilidade elaborado acima deve funcionar sem nenhuma modificação. Se eles não forem ortogonais, você precisará modificar a fórmula para levar isso em consideração, o que pode ser complicado, mas espero que minha resposta tenha dado algumas dicas sobre como isso pode ser.

Jake Westfall
fonte
Você está certo, Jake. O TPI ajustado refere-se à seção VII. REPEATABILIDADE EXTRAPOLADA E HERITABILIDADE no artigo vinculado. Os autores escrevem É importante distinguir entre a repetibilidade de medições individuaisR e a repetibilidade dos meios de medição Rn.
Gabra 11/11