Comparando um modelo misto (sujeito como efeito aleatório) com um modelo linear simples (sujeito como efeito fixo)

Estou terminando algumas análises em um grande conjunto de dados. Eu gostaria de pegar o modelo linear usado na primeira parte do trabalho e reajustá-lo usando um modelo linear misto (LME). O LME seria muito semelhante, exceto que uma das variáveis usadas no modelo seria usada como efeito aleatório. Esses dados são provenientes de muitas observações (> 1000) em um pequeno grupo de sujeitos (~ 10) e eu sei que modelar o efeito do sujeito é melhor feito como um efeito aleatório (essa é uma variável que eu quero mudar). O código R seria semelhante a:

my_modelB <- lm(formula = A ~ B + C + D)    
lme_model <- lme(fixed=A ~ B + C, random=~1|D, data=my_data, method='REML')

Tudo corre bem e os resultados são muito semelhantes. Seria bom se eu pudesse usar algo como RLRsim ou um AIC / BIC para comparar esses dois modelos e decidir qual é o mais apropriado. Meus colegas não querem denunciar a LME porque não há uma maneira facilmente acessível de escolher qual é "melhor", mesmo que eu ache que a LME é o modelo mais apropriado. Alguma sugestão?

r regression hypothesis-testing mixed-model lme4-nlme MudPhud
fonte

Respostas:

A ~ B + CD $H_0: \sigma^2 = 0$ $\chi^2$ $\chi^2$

library(lme4)
my_modelB <- lm(formula = A ~ B + C)
lme_model <- lmer(y ~ B + C + (1|D), data=my_data, REML=F)
lrt.observed <- as.numeric(2*(logLik(lme_model) - logLik(my_modelB)))
nsim <- 999
lrt.sim <- numeric(nsim)
for (i in 1:nsim) {
    y <- unlist(simulate(mymodlB))
    nullmod <- lm(y ~ B + C)
    altmod <- lmer(y ~ B + C + (1|D), data=my_data, REML=F)
    lrt.sim[i] <- as.numeric(2*(logLik(altmod) - logLik(nullmod)))
}
mean(lrt.sim > lrt.observed) #pvalue

A proporção de LRTs com inicialização inicial mais extrema que a LRT observada é o valor p.

bloqueado
fonte

Obrigado por completar minha resposta. Além disso, às vezes as pessoas usam uma mistura de qui-quadrado em vez de uma distribuição de qui-quadrado para a estatística do teste.

Ocram 17/03/11

@ocram +1 para o seu comentário sobre a decisão de tratar a variável como aleatória ou corrigida separadamente da análise. @MudPhud Se o seu PI não entender o problema e insistir em um valor-p, talvez mostre a ele o resultado do teste do efeito aleatório (que você incluiria de qualquer maneira no artigo).

Bloqueado 17/03/11

Obrigado pelo código. Quando eu corria-se o resultado é que nenhum dos LRTS bootstrap são maiores do que o observado, então isso significa que eu posso ficar com o lm sem os efeitos aleatórios ou mesmo a variável original jogados dentro.

MudPhud

@MudPhud: Você recebeu algum erro? Tente digitar lrt.simpara garantir que eles não sejam todos zeros. Nesse caso, o culpado mais provável seria que você não tem o pacote lme4instalado.

Bloqueado 17/03/2019

Eles não são 0, apenas muito pequenos (~ 1e-6) em comparação com o observado (63,95).

MudPhud

$0$ $H_0:variance = 0$ $H_1: variance > 0$ ...

EDITAR

Para evitar confusão: O teste mencionado acima às vezes é usado para decidir se o efeito aleatório é significativo ou não ... mas não para decidir se deve ou não ser transformado em um efeito fixo.

ocram
fonte

A questão é: existe teste para decidir se a variável deve ser modelada como efeito misto ou efeito aleatório? Caso contrário, você pode fazer o teste que você descreveu e depois testá-lo com um qui-quadrado dist (não tenho certeza de qual seria o teste apropriado).

MudPhud

@MudPhud: Modelar uma variável como efeito fixo ou aleatório deve ser decidido antes da análise, quando o estudo é planejado. Depende, em particular, do escopo de suas conclusões. Efeitos aleatórios permitem mais generalização. Também poderia evitar algumas dificuldades técnicas. Por exemplo, os assintóticos podem quebrar quando o número de parâmetros aumentar, como é o caso quando uma variável categórica com muitos níveis é considerada uma variável fixa.

Ocram 17/03/11

Concordo, mas quando tentei explicar isso ao meu IP, ele apenas se virou e pediu algum valor de p. Quero incluir essa análise em um manuscrito, mas ele não a incluirá se não houver uma justificativa mais concreta.

MudPhud

@MudPhud: Que eu saiba, não existe um valor p para essa decisão. Se o interesse centrar-se no efeito dos níveis específicos escolhidos, deve ser considerado fixo. Se os níveis de fatores disponíveis forem vistos como uma amostra aleatória de uma população maior e se forem necessárias inferências para a população maior, o efeito deve ser aleatório.

Ocram 17/03/11