Estou especificando meu modelo mais corretamente?

9

Examinei o Google e este site e ainda estou confuso sobre a função lmer na biblioteca lme4.

Tenho alguns dados coletados de diferentes enfermarias psiquiátricas, que possuem uma estrutura multinível. Para simplificar, selecionarei duas variáveis ​​de nível 2 e duas de nível 1, embora eu realmente tenha mais algumas.

Nível 2 - WardSize [este é o número de pessoas na ala] & WAS [esta é uma medida de quão "agradável" é a ala]

A variável de agrupamento que informa a R quem está em qual ala é chamada "Ward"

Nível um - Gênero [isto é gênero, obviamente] & BSITotal [esta é uma medida da gravidade dos sintomas]

Resultado é auto-rejeição, que novamente é o que parece.

Eu tenho esta fórmula:

help = lmer (fórmula = Auto-rejeição ~ WardSize + WAS + Gênero + BSITotal + (1 | Ward))

Espero que isso signifique "cada indivíduo tenha uma pontuação relacionada ao seu gênero e gravidade dos sintomas, e também um efeito no nível da ala relacionado ao tamanho da ala e quão" agradável "é"

Isso está correto? O que me confunde é que não consigo ver como R pode dizer quais são as variáveis ​​de nível 1 e quais são de nível 2, exceto pela interceptação no nível da enfermaria dada no final.

Se alguém pudesse explicar a notação para que um idiota como eu pudesse entender isso seria ainda melhor.

Muito Obrigado!

Chris Beeley
fonte

Respostas:

11

A especificação do seu modelo está correta.

A interceptação variável para Ward, especificada no Imer como você fez com (1 | Ward), está dizendo que os assuntos dentro de cada ala podem ser mais parecidos entre si em Auto-rejeição por outros motivos que não WardSize ou Gender; portanto, você está controlando heterogeneidade entre enfermarias.

Você pode pensar no "1" como uma coluna de 1s (ou seja, uma constante) nos dados nos quais uma interceptação é adequada. Normalmente, o "1" é implícito automaticamente no lm, por exemplo

lm(Y ~ X1 + X2)

na verdade especifica

lm(Y ~ 1 + X1 + X2)

Agora que você tem seu modelo básico, pode começar a fazer mais perguntas como "A relação entre BSItotal e Auto-rejeição difere entre as alas?"

lmer(formula=Selfreject ~ WardSize + WAS + Gender + BSITotal + (1 + BSITotal | Ward))

Ou seja, tanto a interceptação quanto a inclinação do BSITotal podem diferir entre as alas.

Se você ainda não o comprou, a Análise de Dados da Gelman & Hill Usando Regressão e Modelo Multinível / Modelos Hierárquicos é um ótimo livro que explica os modelos de ajuste como este com o lmer.

M Adams
fonte
1

Aqui está um link para uma explicação de Douglas Bates (que escreveu o lme4) sobre por que não é necessário especificar o nível de efeitos fixos.

Breyer
fonte
2
Bem-vindo ao site, @Breyer. Suspeito que esta seja uma contribuição útil. Você se importaria em dar um breve resumo do argumento, para que os leitores possam decidir se é o que estão procurando ou no caso de um futuro linkrot?
gung - Restabelece Monica
2
Obrigado pela boas-vindas @gung. Certamente, Bates explica que não é necessário especificar níveis para efeitos fixos, porque o pacote lme4 foi escrito para modelos mistos, incluindo, entre outros, modelos hierárquicos / multiníveis. Isso significa que os métodos computacionais não dependem da especificação de níveis, como é o caso do software de regressão multinível especializado (HLM etc) que utiliza a estrutura de dados aninhada na computação.
Breyer #