Gostaria de saber a diferença entre análise de dados em painel e análise de modelo misto. Que eu saiba, tanto os dados do painel quanto os modelos mistos usam efeitos fixos e aleatórios. Se sim, por que eles têm nomes diferentes? Ou eles são sinônimos?
Eu li o seguinte post, que descreve a definição de efeito fixo, aleatório e misto, mas não responde exatamente a minha pergunta: Qual é a diferença entre modelos de efeito fixo, efeito aleatório e efeito misto?
Também ficaria grato se alguém pudesse me encaminhar para uma breve referência (cerca de 200 páginas) sobre análise de modelo misto. Apenas para adicionar, eu preferiria referência de modelagem mista, independentemente do tratamento do software. Explicação principalmente teórica da modelagem mista.
Respostas:
Os dados do painel e os dados do modelo de efeito misto lidam com variáveis aleatórias indexadas duplas . O primeiro índice é para o grupo, o segundo é para os indivíduos do grupo. Para os dados do painel, o segundo índice geralmente é o tempo, e supõe-se que observemos indivíduos ao longo do tempo. Quando o tempo é o segundo índice do modelo de efeito misto, os modelos são chamados de modelos longitudinais. O modelo de efeito misto é melhor compreendido em termos de regressões de 2 níveis. (Para facilitar a exposição, assuma apenas uma variável explicativa)yij
A regressão de primeiro nível é a seguinte
Isso é simplesmente explicado como regressão individual para cada grupo. A regressão de segundo nível tenta explicar a variação nos coeficientes de regressão:
β i = δ 0 + z i 2 δ 1 + v i
Quando você substitui a segunda equação pela primeira, obtém
Os efeitos fixos são o que é fixo, isso significa . Os efeitos aleatórios são u i e v i .γ0 0, γ1, δ0 0, δ1 vocêEu vEu
Agora, para os dados do painel, a terminologia muda, mas você ainda pode encontrar pontos em comum. Os modelos de efeitos aleatórios dos dados do painel são os mesmos do modelo de efeitos mistos com
β i = δ 0
com o modelo se tornando
Onde são efeitos aleatórios.ui
A diferença mais importante entre o modelo de efeitos mistos e os modelos de dados em painel é o tratamento dos regressores . Para modelos de efeitos mistos, são variáveis não aleatórias, enquanto que para modelos de dados em painel sempre se assume que eles são aleatórios. Isso se torna importante ao declarar o que é modelo de efeitos fixos para dados do painel.xij
Para o modelo de efeito misto, assume-se que os efeitos aleatórios e v i são independentes de ε i j e também de x i j e z i , o que sempre é verdadeiro quando x i j e z i são fixos. Se permitirmos que para estocástico x i j isso se torna importante. Portanto, o modelo de efeitos aleatórios para dados em painel assume que x i t não está correlacionado comui vi εij xij zi xij zi xij xit . Mas o modelo de efeito fixo que tem a mesma formaui
and using simple OLS on resulting regression problem. Algebraically this coincides with least square dummy variable regression problem, where we assume thatui are fixed parameters. Hence the name fixed effects model.
There is a lot of history behind fixed effects and random effects terminology in panel data econometrics, which I omitted. In my personal opinion these models are best explained in Wooldridge's "Econometric analysis of cross section and panel data". As far as I know there is no such history in mixed effects model, but on the other hand I come from econometrics background, so I might be mistaken.
fonte
I understand you're looking for a text that describes mixed modelling theory without reference to a software package.
I would recommend Multilevel Analysis, An introduction to basic and advanced multilevel modelling by Tom Snijders and Roel Bosker, about 250pp. It has a chapter on software at the end (which is somewhat outdated now) but the remainder is very approachable theory.
I must say though that I agree with the recommendation above for Multilevel and Longitudinal Models Using Stata by Sophia Rabe-Hesketh and Anders Skrondal. The book is very theoretical and the software component is really just a nice addition to a substantial text. I don't normally use Stata and have the text sitting on my desk and find it extremely well written. It is however much longer than 200pp.
The following texts are all written by current experts in the field and would be useful for anyone wanting more information about these techniques (although they don't specifically fit your request): [I can't link to these because I'm a new user, sorry]
Hoox, Joop (2010). Multilevel Analysis, Techniques and Applications.
Gelman, A., and Hill, J. (2006) Data Analysis Using Regression and Multilevel/Hierarchical Models.
Singer, J. (2003) Applied Longitudinal Data Analysis: Modeling Change and Event Occurance
Raudenbush, S. W., and Bryk, A., S. (2002). Hierarchical Linear Models: Applications and data analysis methods
Luke, Douglas,(2004). Multilevel Modeling
I would also second Wooldridge's text mentioned above, as well as the R text, and the Bristol University Centre for Multilevel Modelling has a bunch of tutorials and information
fonte
I too have wondered about the difference between both as well and having recently found a reference on this topic I understand that "panel data" is a traditional name for datasets that represent a "cross-section or group of people who are surveyed periodically over a given time span". So the "panel" is a group-structure within the dataset, and having such a group the most natural way of analyzing this type of data is via a mixed-modelling approach.
A good reference (regardless if you "speak" R or not) on mixed-effects modelling is the draft of a (?)forthcoming book by Douglas Bates (lme4: Mixed-effects modeling with R).
fonte
@mpiktas deu uma resposta completa. Também gostaria de sugerir a leitura do capítulo 7 da documentação para o pacote de PLM em R . Vale a pena ler a discussão dos autores sobre a diferença entre modelos mistos e dados em painel.
fonte
Se você usar modelos Stata, multinível e longitudinal, usando Stata de Sophia Rabe-Hesketh e Anders Skrondal seria uma boa opção. Dependendo do que exatamente você está interessado, 200 páginas podem estar certas.
fonte
Na minha experiência, a lógica para usar a 'econometria do painel' é que os estimadores de 'efeitos fixos' do painel podem ser usados para controlar várias formas de viés variável omitido.
No entanto, é possível realizar esse tipo de estimativa em um modelo multinível usando uma abordagem do tipo Mundlak , ou seja, incluindo os meios do grupo como regressores extras. Essa abordagem remove a correlação entre o termo de erro e os fatores omitidos no nível do grupo em potencial, revelando o coeficiente 'dentro'. No entanto, por um motivo desconhecido para mim, isso normalmente não é feito na pesquisa aplicada. Esses slides e este documento fornecem uma elaboração.
fonte