É apropriado estimar uma inclinação aleatória sem estimar a inclinação média geral?

7

Estou tentando estimar se existem diferenças em como indivíduos em cidades diferentes (minha variável de agrupamento) respondem a algumas variáveis ​​preditoras. Então, na prática, estou interessado em aprender sobre oβs de cada cidade. Mas quero usar inclinações aleatórias para que essas estimativas sejam "reduzidas" em relação a alguma média de grupo.

Estou ajustando meu modelo usando stan_glmero stanarmpacote, que aceita entradas da mesma maneira que a glmerpartir de lme4.

Então, pergunta # 1. Se eu não me importo com a grande inclinação, está tudo bem especificar o modelo assim:

stan_glmer(Y ~ (V1 + V2 + V3|city))

Ou preciso incluir V1, V2, V3 como "efeitos fixos" primeiro? por exemplo

stan_glmer(Y ~ V1 + V2 + V3 + (V1 + V2 + V3|city))

Em segundo lugar, se o segundo modelo é a opção correta (que de certa forma suspeito), como interpreto a saída? Para obter uma estimativa da inclinação de V1 na cidade 1, adiciono o valor geralβv1 para a cidade 1 βv1? Como você explica o erro nesse caso?

Obrigado!

Sama
fonte

Respostas:

9

Ajustar inclinações aleatórias com a inclinação do nível da população fixa a zero não está fora de questão - não é matematicamente ou estatisticamente incorreto - mas é um modelo bastante estranho que exigiria alguma justificativa extra. Por que você esperaria que a inclinação média entre as cidades fosse exatamente zero (que é o que está implícito no modelo que omite o efeito fixo)? Os únicos casos em que vi montagem desses modelos fazem sentido são

  • como um modelo nulo (reconhecidamente bobo), para fazer um teste de razão de verossimilhança da significância da inclinação no nível da população [não é relevante no seu caso, pois você está usando métodos bayesianos]
  • nos casos em que o efeito é zero com base no projeto experimental, por exemplo, quando as amostras são aleatoriamente designadas para condições de teste e tratamento em uma condição de pré-tratamento (isso eliminaria um efeito fixo do tratamento no período "anterior", não um período fixo) inclinação, mas a ideia é semelhante).

Se você tem uma inclinação de efeito fixo e uma variação entre cidades na inclinação, você realmente precisa adicionar a inclinação no nível da população ao desvio da inclinação da cidade individual e usar a distribuição posterior da soma por inferência - eu não ' não sei exatamente como isso é feito rstanarm( relacionado ) ... o tidybayespacote pode ajudar.

Ben Bolker
fonte
Obrigado @Ben. Eu estava trabalhando para entender que o primeiro modelo estaria forçando a inclinação desse grupo a zero, o que, como você diz, não é o que eu quero. Vou olhar para se rstanarmou tidyversepode gerar quantidades calculadas para mim e interpretar esses.
Sama