Em um modelo multinível, quais são as implicações práticas e relacionadas à interpretação de estimar versus não estimar parâmetros de correlação de efeito aleatório? A razão prática para perguntar isso é que, na estrutura anterior em R, não há método implementado para estimar valores de p por meio de técnicas MCMC quando são feitas estimativas no modelo de correlações entre parâmetros.
Por exemplo, olhando para este exemplo (partes citadas abaixo), quais são as implicações práticas de M2 versus M3. Obviamente, em um caso, P5 não será estimado e, no outro, será.
Questões
- Por razões práticas (o desejo de obter um valor-p através das técnicas MCMC), pode-se querer ajustar um modelo sem correlações entre efeitos aleatórios, mesmo que P5 seja substancialmente diferente de zero. Se alguém fizer isso e depois estimar valores de p através da técnica MCMC, os resultados são interpretáveis? (Eu sei que o @Ben Bolker mencionou anteriormente que "combinar o teste de significância com o MCMC é um pouco incoerente, estatisticamente, embora eu compreenda o desejo de fazê-lo (obter intervalos de confiança é mais suportável)" , por isso, se você for dormir melhor à noite finja que disse intervalos de confiança.)
- Se alguém não estimar P5, é o mesmo que afirmar que é 0?
- Se P5 realmente for diferente de zero, de que maneira os valores estimados de P1-P4 são afetados?
- Se P5 realmente for diferente de zero, de que maneira as estimativas de erro para P1-P4 são afetadas?
- Se P5 realmente for diferente de zero, então de que maneira as interpretações de um modelo estão deixando de incluir P5 com falhas?
Tomando emprestado a resposta de @Mike Lawrence (os que têm mais conhecimento do que eu são livres para substituí-lo pela notação completa do modelo, não estou totalmente confiante de que posso fazê-lo com razoável fidelidade):
M2: V1 ~ (1|V2) + V3 + (0+V3|V2)
(Estimativas P1 - P4)
M3: V1 ~ (1+V3|V2) + V3
(estimativas P1-P5)
Parâmetros que podem ser estimados:
P1 : Uma interceptação global
P2 : Efeito aleatório intercepta para V2 (ou seja, para cada nível de V2, o desvio desse intercepto em relação à interceptação global)
P3 : Uma estimativa global única para o efeito (declive) de V3
P4 : O efeito de V3 em cada nível de V2 (mais especificamente, o grau em que o efeito de V3 em um determinado nível se desvia do efeito global de V3), enquanto impõe uma correlação zero entre os desvios de interceptação e os desvios de efeito V3 nos níveis de V2.
P5 : A correlação entre os desvios de interceptação e os desvios de V3 nos níveis de V2
Respostas derivadas de uma simulação suficientemente grande e ampla, juntamente com o código que acompanha R em Lmer, seriam aceitáveis.
fonte
Respostas:
Considere os dados do estudo do sono, incluídos no lme4. Bates discute isso em seu livro on-line sobre lme4. No capítulo 3, ele considera dois modelos para os dados.
e
O estudo envolveu 18 indivíduos, estudados por um período de 10 dias privados de sono. Os tempos de reação foram calculados na linha de base e nos dias subsequentes. Há um efeito claro entre o tempo de reação e a duração da privação do sono. Também existem diferenças significativas entre os sujeitos. O modelo A permite a possibilidade de uma interação entre os efeitos de interceptação aleatória e inclinação: imagine, digamos, que pessoas com tempos de reação ruins sofram mais agudamente dos efeitos da privação do sono. Isso implicaria uma correlação positiva nos efeitos aleatórios.
No exemplo de Bates, não houve correlação aparente do gráfico Lattice e nenhuma diferença significativa entre os modelos. No entanto, para investigar a questão colocada acima, decidi pegar os valores ajustados do estudo do sono, aumentar a correlação e analisar o desempenho dos dois modelos.
Como você pode ver na imagem, longos tempos de reação estão associados a uma maior perda de desempenho. A correlação utilizada para a simulação foi de 0,58
Simulei 1000 amostras, usando o método simule no lme4, com base nos valores ajustados dos meus dados artificiais. Encaixei M0 e Ma em cada uma e observei os resultados. O conjunto de dados original teve 180 observações (10 para cada um dos 18 indivíduos) e os dados simulados têm a mesma estrutura.
A linha inferior é que há muito pouca diferença.
Então porque isso acontece? @gung imaginou, razoavelmente, que a falha em incluir a possibilidade de uma correlação força os efeitos aleatórios a não serem correlacionados. Talvez deva; mas nessa implementação, os efeitos aleatórios podem ser correlacionados, o que significa que os dados são capazes de puxar os parâmetros na direção certa, independentemente do modelo. O erro do modelo errado aparece na probabilidade, razão pela qual você pode (às vezes) distinguir os dois modelos nesse nível. O modelo de efeitos mistos está basicamente ajustando regressões lineares para cada sujeito, influenciado pelo que o modelo pensa que deveria ser. O modelo errado força o ajuste de valores menos plausíveis do que o modelo correto. Mas os parâmetros, no final do dia, são governados pelo ajuste aos dados reais.
Aqui está o meu código um pouco desajeitado. A idéia era ajustar os dados do estudo do sono e, em seguida, construir um conjunto de dados simulados com os mesmos parâmetros, mas uma correlação maior para os efeitos aleatórios. Esse conjunto de dados foi alimentado para simular.lmer () para simular 1000 amostras, cada uma das quais se encaixava nos dois sentidos. Depois de emparelhar os objetos ajustados, eu poderia extrair diferentes recursos do ajuste e compará-los, usando testes t ou qualquer outra coisa.
fonte
O Placidia já forneceu uma resposta completa usando dados simulados com base no
sleepstudy
conjunto de dados. Aqui está outra resposta (menos rigorosa) que também usa ossleepstudy
dados.Vemos que é possível afetar a correlação estimada entre a interceptação aleatória e a inclinação aleatória "deslocando" a variável preditora aleatória. Veja os resultados dos modelos
fm1
efm2
abaixo:A partir da saída do modelo, vemos que a correlação de variação aleatória mudou. No entanto, as inclinações (fixas e aleatórias) permaneceram as mesmas, assim como a estimativa da variância residual. As estimativas de interceptações (fixas e aleatórias) foram alteradas em resposta à variável deslocada.
A covariância aleatória de intercepto-inclinação para LMMs é discutida nas notas de aula do Dr. Jack Weiss aqui . Weiss observa que reduzir a correlação de variância dessa maneira às vezes pode ajudar na convergência do modelo, entre outras coisas.
O exemplo acima varia a correlação aleatória (parâmetro "P5"). Parcialmente abordando o Q3 do OP, vemos pela saída acima que:
fonte