É apropriado estimar uma inclinação aleatória sem estimar a inclinação média geral?

Estou tentando estimar se existem diferenças em como indivíduos em cidades diferentes (minha variável de agrupamento) respondem a algumas variáveis preditoras. Então, na prática, estou interessado em aprender sobre o $\beta$ s de cada cidade. Mas quero usar inclinações aleatórias para que essas estimativas sejam "reduzidas" em relação a alguma média de grupo.

Estou ajustando meu modelo usando stan_glmero stanarmpacote, que aceita entradas da mesma maneira que a glmerpartir de lme4.

Então, pergunta # 1. Se eu não me importo com a grande inclinação, está tudo bem especificar o modelo assim:

stan_glmer(Y ~ (V1 + V2 + V3|city))

Ou preciso incluir V1, V2, V3 como "efeitos fixos" primeiro? por exemplo

stan_glmer(Y ~ V1 + V2 + V3 + (V1 + V2 + V3|city))

Em segundo lugar, se o segundo modelo é a opção correta (que de certa forma suspeito), como interpreto a saída? Para obter uma estimativa da inclinação de V1 na cidade 1, adiciono o valor geral $\beta_{v1}$ para a cidade 1 $\beta_{v1}$ ? Como você explica o erro nesse caso?

Obrigado!

mixed-model lme4-nlme stan Sama
fonte

Respostas:

Ajustar inclinações aleatórias com a inclinação do nível da população fixa a zero não está fora de questão - não é matematicamente ou estatisticamente incorreto - mas é um modelo bastante estranho que exigiria alguma justificativa extra. Por que você esperaria que a inclinação média entre as cidades fosse exatamente zero (que é o que está implícito no modelo que omite o efeito fixo)? Os únicos casos em que vi montagem desses modelos fazem sentido são

como um modelo nulo (reconhecidamente bobo), para fazer um teste de razão de verossimilhança da significância da inclinação no nível da população [não é relevante no seu caso, pois você está usando métodos bayesianos]
nos casos em que o efeito é zero com base no projeto experimental, por exemplo, quando as amostras são aleatoriamente designadas para condições de teste e tratamento em uma condição de pré-tratamento (isso eliminaria um efeito fixo do tratamento no período "anterior", não um período fixo) inclinação, mas a ideia é semelhante).

Se você tem uma inclinação de efeito fixo e uma variação entre cidades na inclinação, você realmente precisa adicionar a inclinação no nível da população ao desvio da inclinação da cidade individual e usar a distribuição posterior da soma por inferência - eu não ' não sei exatamente como isso é feito rstanarm( relacionado ) ... o tidybayespacote pode ajudar.

Ben Bolker
fonte

Obrigado @Ben. Eu estava trabalhando para entender que o primeiro modelo estaria forçando a inclinação desse grupo a zero, o que, como você diz, não é o que eu quero. Vou olhar para se rstanarmou tidyversepode gerar quantidades calculadas para mim e interpretar esses.

Sama