Reconciliando notações para modelos mistos

12

Estou familiarizado com notações como:

ondeβ0j=β0+uj, e

yij=β0+βixij+uj+eij=β0j+βixij+eij
β0j=β0+uj

ondeβ0j=β0+u0jeβ1j=β1+u1j

yij=β0+β1xij+u0j+u1jxij+eij=β0j+β1jxij+eij
β0j=β0+u0jβ1j=β1+u1j

para um modelo de interceptações aleatórias e uma inclinação aleatória + modelo de interceptações aleatórias, respectivamente.

Eu também me deparei com essa notação de matriz / vetor, que me disseram que é "notação de modelo misto para adultos" (de acordo com meu irmão mais velho):

onde β são os efeitos fixos eb são os efeitos aleatórios.

y=Xβ+Zb+e
βb

Se entendi corretamente, a última notação é uma notação mais geral para a primeira, que são versões específicas da última.

Gostaria de ver como o primeiro pode ser derivado do último.

Joe King
fonte
2
Você está perguntando sobre uma explicação da notação matricial? A razão pela qual pergunto é que essa pergunta não precisa de derivação matemática: todas as suas fórmulas estão dizendo exatamente as mesmas coisas e relacionando-as umas com as outras é apenas uma questão de entender como funciona a notação matricial.
whuber
@ whuber Entendo notação matricial e álgebra matricial, até certo ponto. Mas não sei como começar a partir da forma matricial e chegar às outras formas. Provavelmente eu não entendo algo sobre as matrizes X e Z, mas estava apenas esperando que alguém explicasse isso.
Joe King
@whuber há algo que eu possa fazer para melhorar a pergunta, ou você está dizendo que é tão básico que não merece uma resposta?
21813 Joe King
@ JoeKing: Eu acho que ele está dizendo que a notação matricial é por definição equivalente à sua notação não matricial. Ou seja, você já possui (matriz ixj vezes matriz jx1 produzindo matriz ix1 y i ) que é y = X β . (É possível rolar β 0 em β pela inclusão de um 1 em X .)xijβiyiy=Xββ0βX
Wayne
2
@Wayne ambos os modelos têm efeitos aleatórios e efeitos fixos. O primeiro tem uma interceptação aleatória, enquanto o segundo tem uma interceptação aleatória e uma inclinação aleatória. Se eu pudesse "descobrir" eu não estaria fazendo a pergunta aqui !!!!
22613 Joe King

Respostas:

13

Consideramos um modelo misto com inclinações aleatórias e interceptações aleatórias. Dado que temos apenas um regressor, esse modelo pode ser escrito como onde y i j indica i - ª observação do grupo j da resposta, e x i j e ϵ i j

yij=β0+β1xij+u0j+u1jxij+ϵij,
yijijxijϵij o respectivo preditor e termo do erro.

Este modelo pode ser expresso em notação matricial da seguinte maneira:

que é equivalente a

Y=Xβ+Zb+ϵ,

Y=[XZ][βb]+ϵ

Vamos assumir que temos grupos , ou seja, j = 1 , ... , J e vamos n j denotar o número de observações no j- ésimo grupo. Particionado para cada grupo, podemos escrever a fórmula acima comoJj=1,,Jnjj

[Y1Y2YJ]=[X1Z1000X20Z200XJ000ZJ][βb1b2bJ]+[ϵ1ϵ2ϵJ]

onde é uma matriz n j × 1 contendo todas as observações da resposta para o grupo j , X j e Z j são n j × 2 matrizes de design nesse caso e ϵ j é novamente uma matriz n j × 1 .Yjnj×1jXjZjnj×2ϵjnj×1

Escrevendo-os, temos:

Yj=[y1jy2jynjj],Xj=Zj=[1x1j1x2j1xnjj]ϵj=[ϵ1jϵ2jϵnjj].

Os vetores do coeficiente de regressão são então

β=(β0β1)bj=(u0ju1j)

To see that the two model formulations are indeed equivalent, let us look at any of the groups (let's say the j-th one).

Yj=Xjβ+Zjbj+ϵj

Applying above definitions, one can show that the i-th row of the resulting vector is just

yij=β0+β1xij+u0j+u1jxij+ϵij,
where i ranges from 1 to nj.
Philipp Burckhardt
fonte
2
+1, I would just point out that there are large computational advantages from implementing using Zj rather than the full Z matrix. The Zj are basically a sparse matrix storage version of Z
probabilityislogic