A distinção entre variáveis estritamente aleatórias (que devem ser modeladas como tais) e variáveis não aleatórias que alguns argumentam que poderiam ser modeladas como aleatórias se for um modelo hierárquico / multinível, é pouco clara para mim.
Bates e Bolker exemplificam efeitos aleatórios com casos de verdadeira aleatoriedade, por exemplo, qualidade de produtos em amostras selecionadas aleatoriamente. Embora o lme4
trabalho deles seja incrível, ainda não está claro onde a linha vai entre aleatória e não aleatória. As discussões nas ciências sociais tornam isso ainda mais embaçado. Modelos multiníveis / hierárquicos e modelos de efeito aleatório são computacionalmente iguais lme4
; então, onde traçamos a linha?
Por exemplo, eu tenho um conjunto de dados com medidas repetidas em vários indivíduos (isso é aleatório!), Mas acredito, e resulta do lme4
programa, que uma grande proporção de variação está dentro de suas variáveis socioeconômicas (como área de vida, raça etc.). Essas variáveis não são aleatórias, mas os modelos multiníveis argumentam que elas podem ser usadas como tal. Outros exemplos vêm de estudos sobre as notas dos alunos, geralmente aninhando os alunos nos professores e ainda mais nas escolas. Todas essas variáveis são constantes.
Podemos modelar fatores não aleatórios como aleatórios se for plausível no domínio dos modelos multiníveis (hierárquicos)?
fonte
Respostas:
Estou intrigado com sua pergunta. Eu sei que você diz que entende efeitos fixos vs. aleatórios, mas talvez você não os entenda da mesma maneira que eu. Eu publiquei um trecho bastante extenso de um in-prima capítulo de livro aqui que explica meu ponto de vista (em vez pragmática, bastante alinhado com Andrew Gelman de).
Respondendo mais diretamente à pergunta:
Pode adicionar clareza para distinguir entre variáveis de agrupamento (que devem ser categóricas), que representam os grupos nos quais as coisas variam e efeitos , que são as diferenças em algum parâmetro / efeito (geralmente a interceptação, mas podem ser os efeitos da renda / educação / o que for) entre os níveis de alguma variável de agrupamento.
atualização : tomarei a liberdade de dar um contraponto ao seu
Não sei ao certo o que isso significa. Você sabe de que bairro cada observação vem, certo? Como isso é "não observado"? (Se você suspeitou de agrupar seus dados com base em fatores não observados , seria necessário ajustar um modelo de mistura discreto .) Se você quer dizer que não sabe por que os bairros são diferentes, não acho que isso importe aqui.
A única razão pela qual posso pensar em não usar vizinhança como um efeito aleatório seria se você tivesse medido apenas um pequeno número (digamos <6) de vizinhanças.
fonte