Executei um projeto repetido, no qual testei 30 homens e 30 mulheres em três tarefas diferentes. Quero entender como o comportamento de homens e mulheres é diferente e como isso depende da tarefa. Eu usei o pacote lmer e o lme4 para investigar isso, no entanto, estou tentando verificar suposições para qualquer um dos métodos. O código que eu corro é
lm.full <- lmer(behaviour ~ task*sex + (1|ID/task), REML=FALSE, data=dat)
lm.full2 <-lme(behaviour ~ task*sex, random = ~ 1|ID/task, method="ML", data=dat)
Verifiquei se a interação era o melhor modelo comparando-o com o modelo mais simples sem a interação e executando uma anova:
lm.base1 <- lmer(behaviour ~ task+sex+(1|ID/task), REML=FALSE, data=dat)
lm.base2 <- lme(behaviour ~ task+sex, random= ~1|ID/task), method="ML", data=dat)
anova(lm.base1, lm.full)
anova(lm.base2, lm.full2)
P1: É aceitável usar esses preditores categóricos em um modelo misto linear?
P2: Eu entendi corretamente que a variável de resultado ("comportamento") não precisa ser distribuída normalmente (por sexo / tarefas)?
Q3: Como posso verificar a homogeneidade da variação? Para um modelo linear simples, eu uso plot(LM$fitted.values,rstandard(LM))
. O uso é plot(reside(lm.base1))
suficiente?
Q4: para verificar a normalidade está usando o seguinte código ok?
hist((resid(lm.base1) - mean(resid(lm.base1))) / sd(resid(lm.base1)), freq = FALSE); curve(dnorm, add = TRUE)
fonte
Respostas:
Q1: Sim - como qualquer modelo de regressão.
P2: Assim como os modelos lineares gerais, sua variável de resultado não precisa ser normalmente distribuída como uma variável univariada. No entanto, os modelos LME assumem que os resíduos do modelo são normalmente distribuídos. Portanto, uma transformação ou adição de pesos ao modelo seria uma maneira de cuidar disso (e verificar com gráficos de diagnóstico, é claro).
Q3:
plot(myModel.lme)
Q4:
qqnorm(myModel.lme, ~ranef(., level=2))
. Este código permitirá que você faça gráficos de QQ para cada nível dos efeitos aleatórios. Os modelos LME assumem que não apenas os resíduos dentro do cluster são normalmente distribuídos, mas que cada nível dos efeitos aleatórios também. Varielevel
de 0, 1 a 2 para que você possa verificar o rato, a tarefa e os resíduos dentro do assunto.EDIT: Devo acrescentar que, embora a normalidade seja assumida e que a transformação provavelmente ajude a reduzir problemas com erros / efeitos aleatórios não normais, não está claro que todos os problemas sejam realmente resolvidos ou que o viés não seja introduzido. Se seus dados exigirem uma transformação, tenha cuidado com a estimativa dos efeitos aleatórios. Aqui está um artigo abordando isso .
fonte
Você parece bastante enganado sobre as suposições que envolvem modelos de vários níveis. Não há uma suposição de homogeneidade de variação nos dados, apenas que os resíduos devem ser aproximadamente normalmente distribuídos. E preditores categóricos são usados em regressão o tempo todo (a função subjacente em R que executa uma ANOVA é o comando de regressão linear).
Para detalhes sobre o exame de suposições, consulte o livro Pinheiro e Bates (p. 174, seção 4.3.1). Além disso, se você planeja usar o lme4 (no qual o livro não está escrito), você pode replicar seus gráficos usando plot com um
lmer
modelo (?plot.merMod
).Para verificar rapidamente a normalidade, seria apenas
qqnorm(resid(myModel))
.fonte
Em relação ao Q2:
De acordo com o livro de Pinheiro e Bates, você pode usar a seguinte abordagem:
Se você deseja verificar variações iguais entre
sex
si, use esta abordagem:Se as variações forem diferentes, você poderá atualizar seu modelo da seguinte maneira:
Além disso, você pode dar uma olhada na
robustlmm
embalagem, que também usa uma abordagem de pesagem. A tese de doutorado de Koller sobre esse conceito está disponível como acesso aberto ("Estimativa Robusta de Modelos Mistos Lineares"). O resumo declara:Não tenho pontos suficientes para comentários. No entanto, vejo a necessidade de esclarecer alguns aspectos da resposta de @John acima. Pinheiro e Bates afirmam na p. 174:
Essa afirmação não é de fato clara sobre variações homogêneas e eu não sou suficientemente aprofundado em estatística para conhecer todas as matemáticas por trás do conceito LME. No entanto, na p. 175, §4.3.1, na seção que trata da Assunção 1, eles escrevem:
Além disso, nos exemplos a seguir, " variações constantes " são realmente importantes. Assim, pode-se especular se eles implicam variações homogêneas quando escrevem " distribuição idêntica normalmente" na p. 174 sem abordá-lo mais diretamente.
fonte
Q1: Sim, por que não?
P2: Acho que o requisito é que os erros sejam normalmente distribuídos.
Q3: Pode ser testado com o teste de Leven, por exemplo.
fonte