Eu tenho usado o MCMCglmm
pacote recentemente. Estou confuso com o que é referido na documentação como estrutura R e estrutura G. Eles parecem estar relacionados aos efeitos aleatórios - em particular especificando os parâmetros para a distribuição anterior sobre eles, mas a discussão na documentação parece assumir que o leitor sabe quais são esses termos. Por exemplo:
lista opcional de especificações anteriores com 3 elementos possíveis: R (estrutura R) G (estrutura G) e B (efeitos fixos) ............ Os anteriores para as estruturas de variação (R e G ) são listas com as (co) variações esperadas (V) e o parâmetro do grau de crença (nu) para o inverso-Wishart
... tirado daqui .
EDIT: Observe que reescrevi o restante da pergunta após os comentários de Stephane.
Alguém pode esclarecer o que são a estrutura R e a estrutura G, no contexto de um modelo de componentes de variação simples em que o preditor linear é com e e 0 i j ∼ N ( 0 , σ 2 0 e ) u 0 j ∼ N (
Fiz o exemplo a seguir com alguns dados que acompanham MCMCglmm
> require(MCMCglmm)
> require(lme4)
> data(PlodiaRB)
> prior1 = list(R = list(V = 1, fix=1), G = list(G1 = list(V = 1, nu = 0.002)))
> m1 <- MCMCglmm(Pupated ~1, random = ~FSfamily, family = "categorical",
+ data = PlodiaRB, prior = prior1, verbose = FALSE)
> summary(m1)
G-structure: ~FSfamily
post.mean l-95% CI u-95% CI eff.samp
FSfamily 0.8529 0.2951 1.455 160
R-structure: ~units
post.mean l-95% CI u-95% CI eff.samp
units 1 1 1 0
Location effects: Pupated ~ 1
post.mean l-95% CI u-95% CI eff.samp pMCMC
(Intercept) -1.1630 -1.4558 -0.8119 463.1 <0.001 ***
---
> prior2 = list(R = list(V = 1, nu = 0), G = list(G1 = list(V = 1, nu = 0.002)))
> m2 <- MCMCglmm(Pupated ~1, random = ~FSfamily, family = "categorical",
+ data = PlodiaRB, prior = prior2, verbose = FALSE)
> summary(m2)
G-structure: ~FSfamily
post.mean l-95% CI u-95% CI eff.samp
FSfamily 0.8325 0.3101 1.438 79.25
R-structure: ~units
post.mean l-95% CI u-95% CI eff.samp
units 0.7212 0.04808 2.427 3.125
Location effects: Pupated ~ 1
post.mean l-95% CI u-95% CI eff.samp pMCMC
(Intercept) -1.1042 -1.5191 -0.7078 20.99 <0.001 ***
---
> m2 <- glmer(Pupated ~ 1+ (1|FSfamily), family="binomial",data=PlodiaRB)
> summary(m2)
Generalized linear mixed model fit by the Laplace approximation
Formula: Pupated ~ 1 + (1 | FSfamily)
Data: PlodiaRB
AIC BIC logLik deviance
1020 1029 -508 1016
Random effects:
Groups Name Variance Std.Dev.
FSfamily (Intercept) 0.56023 0.74849
Number of obs: 874, groups: FSfamily, 49
Fixed effects:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.9861 0.1344 -7.336 2.2e-13 ***
Portanto, com base nos comentários de Stephane, acho que a estrutura G é para . Mas os comentários também dizem que a estrutura R é para mas isso não parece aparecer na saída.lme4
Observe que os resultados de lme4/glmer()
são consistentes com os dois exemplos do MCMC MCMCglmm
.
Então, é a estrutura R para e por que isso não aparece na saída ?lme4/glmer()
fonte
lme4
Respostas:
Eu preferiria postar meus comentários abaixo como um comentário, mas isso não seria suficiente. Essas são perguntas, e não uma resposta (semelhante a @gung, não me sinto forte o suficiente sobre o assunto).
Estou com a impressão de que o MCMCglmm não implementa um glmm bayesiano "verdadeiro". O verdadeiro modelo bayesiano é descrito na seção 2 deste artigo . Da mesma forma que o modelo freqüentista, um tem e há um requisito prévio no parâmetro de dispersão , além dos parâmetros fixos e da variação "G" do efeito aleatório .φ 1 β ug(E(y∣u))=Xβ+Zu ϕ1 β u
Porém, de acordo com essa vinheta do MCMCglmm , o modelo implementado no MCMCglmm é dado por , e não envolve o parâmetro de dispersão . Não é semelhante ao modelo freqüentista clássico.g(E(y∣u,e))=Xβ+Zu+e ϕ1
Portanto, não ficaria surpreso que não exista um análogo de com o glmer.σe
Por favor, peça desculpas por esses comentários grosseiros, apenas dei uma olhada rápida sobre isso.
fonte
glmer
MCMCglmm
MCMCglmm
MCMCglmm
usando vários parâmetros, e os intervalos de 95% credíveis sempre contêm o valor de variação para os efeitos aleatórios estimados,glmer
então achei que isso era razoável. , mas como devo interpretar esse caso, que pode não ser típico, onde o resultado é que osMCMCglmm
intervalos não são muito sensíveis à escolha do anterior? Talvez eu deva fazer uma nova pergunta sobre isso?glmer
Estou atrasado para o jogo, mas algumas notas. A estrutura é a estrutura residual. No seu caso, a "estrutura" possui apenas um único elemento (mas isso não precisa ser o caso). Para a variável de resposta gaussiana, a variação residual, é normalmente estimada. Para resultados binários, é mantido constante. Devido à forma como o MCMCglmm está configurado, você não pode corrigi-lo em zero, mas é relativamente padrão corrigi-lo em (também verdadeiro para um modelo probit). Para dados de contagem (por exemplo, com uma distribuição de poisson), você não o corrige e isso estima automaticamente um parâmetro de superdispersão essencialmente.R σ2e 1
A estrutura é a estrutura de efeitos aleatórios. Novamente no seu caso, apenas uma interceptação aleatória, mas se você tivesse vários efeitos aleatórios, eles formariam uma matriz de variância-covariância, .G G
Uma observação final, como a variação residual não é fixada em zero, as estimativas não serão iguais às de
glmer
. Você precisa revalorizá-los. Aqui está um pequeno exemplo (sem usar efeitos aleatórios, mas generaliza). Observe como a variação da estrutura R é fixada em 1.Aqui está a constante de redimensionamento da família binomial:
Agora divida a solução por ela e obtenha os modos posteriores
O que deve ser bastante próximo do que obtemos
glm
fonte
123
, recebo (com a correção) dosm2
valores-8.164
e0.421
; e a partirglm
dos valores-8.833
e0.430
.