Por que os efeitos aleatórios são reduzidos para 0?

10

Existe uma razão intuitiva para que os efeitos aleatórios sejam reduzidos em relação ao seu valor esperado no modelo misto linear geral?

user7064
fonte
Você pode fornecer um pouco mais de contexto para esta pergunta?
Macro
Os valores previstos dos modelos de efeito aleatório são estimadores de retração ; haverá pouca skrinkage quando as unidades estatísticas forem diferentes, ou quando as medições forem precisas, ou com amostras grandes. É isso que você procura, ou você realmente quer dizer encolhimento em relação ao valor esperado?
chl
3
Eu sugeriria um artigo mais antigo de Bradley Efron e Carl Morris, Paradox in Stein's Statistics (1977) (um PDF on-line está aqui ). Não tenho certeza se é intuitivo, mas é uma introdução bastante gentil (com exemplos do mundo real) ao conceito de encolhimento.
Andy W

Respostas:

4

de um modo geral, a maioria dos "efeitos aleatórios" ocorre em situações em que também há um "efeito fixo" ou alguma outra parte do modelo. O modelo misto linear geral é assim:

yi=xiTβ+ziTu+ϵi

Onde são os "efeitos fixos" e são os "efeitos aleatórios". Claramente, a distinção só pode estar no nível conceitual ou no método de estimativa de e . Pois se eu definir um novo "efeito fixo" e então eu tenha uma regressão linear comum:βuuβx~i=(xiT,ziT)Tβ~=(βT,uT)T

yi=x~iTβ~+ϵi

Geralmente, esse é um problema prático real quando se trata de ajustar modelos mistos quando os objetivos conceituais subjacentes não são claros. Eu acho que o fato de que os efeitos aleatórios foram reduzidos para zero e que os efeitos fixos não fornecem ajuda aqui. Isso significa que vamos tendem a favorecer o modelo com apenas incluído (ou seja, ) quando as estimativas de têm baixa precisão na formulação OLS, e tendem a favorecer a formulação OLS completo quando as estimativas tem alta precisão.u β βu=0uu

probabilityislogic
fonte
2

Sua pergunta não se responde? Se um valor é esperado, uma técnica que aproxime valores seria a melhor.

Uma resposta simples vem da lei dos grandes números. Digamos que os assuntos sejam seu efeito aleatório. Se você administrar os sujeitos A a D em 200 tentativas e a E em 20 tentativas, qual desempenho médio medido da pessoa você acha que é mais representativo de mu? A lei dos grandes números prediz que o desempenho do sujeito E terá uma probabilidade maior de se desviar de mu do que qualquer um de A a D. Pode ou não, e qualquer um dos assuntos pode se desviar, mas teríamos muito mais justificado em diminuir o efeito do sujeito E em relação ao sujeito A a D do que o contrário. Portanto, efeitos aleatórios que são maiores e têm N menores tendem a ser os que mais diminuem.

A partir dessa descrição também vem o porquê de efeitos fixos não serem reduzidos. É porque eles são fixos, há apenas um no modelo. Você não tem referência para encolhê-lo. Você pode usar uma inclinação de 0 como referência, mas não é para isso que os efeitos aleatórios são reduzidos. Eles são direcionados a uma estimativa geral, como mu. O efeito fixo que você tem do seu modelo é essa estimativa.

John
fonte
1

Acho que pode ser útil para sua intuição pensar em um modelo misto como um modelo hierárquico ou multinível . Pelo menos para mim, faz mais sentido quando penso em aninhar e como o modelo está trabalhando dentro e entre categorias de maneira hierárquica.

Edição: Macro, eu tinha deixado isso um pouco em aberto, porque me ajuda a vê-lo de forma mais intuitiva, mas não tenho certeza se está correto. Mas para expandi-lo em direções possivelmente incorretas ...

Eu vejo isso como efeitos fixos em média entre categorias e efeitos aleatórios que distinguem entre categorias. Em certo sentido, os efeitos aleatórios são "aglomerados" que compartilham algumas características, e aglomerados maiores e mais compactos terão maior influência sobre a média no nível mais alto.

Com o OLS fazendo o ajuste (em fases, acredito), "aglomerados" de efeito aleatório maiores e mais compactos puxarão o ajuste mais fortemente para si, enquanto "aglomerados" menores ou mais difusos puxam menos o ajuste. Ou talvez o ajuste comece mais perto de "aglomerados" maiores e mais compactos, já que a média de nível superior está mais próxima de começar

Desculpe, não posso ser mais claro e pode até estar errado. Faz sentido para mim intuitivamente, mas, enquanto tento escrever, não tenho certeza se é algo de cima para baixo ou de baixo para cima, ou algo diferente. É uma questão de "aglomerados" de nível inferior se ajustarem mais fortemente a eles mesmos, ou de ter maior influência sobre a média de nível superior - e, assim, "acabar" mais próximo da média de nível superior - ou não?

Em qualquer um dos casos, acho que explica por que categorias menores e mais difusas de variáveis ​​aleatórias serão puxadas mais para a média do que categorias maiores e mais compactas.

Wayne
fonte
Oi Wayne, você pode expandir isso para descrever como o encolhimento pode ser (talvez mais intuitivamente) conceitualizado ao pensar nisso como um modelo hierárquico?
Macro
@ Macro: OK, tentei. Não tenho certeza se a resposta é melhor ou pior.
Wayne