Especificação de dados do painel

8

Estou tentando descobrir a melhor especificação para o meu conjunto de dados.

Estou tentando investigar a eficácia das zonas econômicas especiais na Polônia no significado de crescimento da economia em três modelos de dados de painel semelhantes para variáveis ​​explicadas: a) taxa de desemprego registrada b) PIB per capita c) formação bruta de capital fixo per capita . Os dados são para sub-regiões NUTS3. As variáveis ​​explicativas são: 0-1 para presença da ZEE na sub-região no ano e algumas das variáveis ​​econômicas; frequência anual, o conjunto de dados é 2004-2012 para 66 sub-regiões.t

Eu tentei efeitos fixos e aleatórios. Por enquanto, eu escolhi a EF, por causa do significado e de sinais teoricamente corretos. Mas existem alguns problemas que me impedem de tomar isso como garantido:

  1. Como testar autocorrelação e correlação cruzada?

  2. Não tenho idéia de como testar a distribuição do termo de erro no Stata e, além disso, se ele não for normalmente distribuído, devo me preocupar muito com isso?

  3. Pelo que entendi da literatura, os valores do coeficiente de correlação entre variáveis ​​explicativas e o termo de erro próximo a -1 ou 1 não são ruins; no meu caso, é quase -1, como você pode ver.

  4. Um modelo misto é apropriado para meu conjunto de dados?

Anexo o resultado do modelo que explica a taxa de desemprego.

Código:

xtreg  st_bezr sse01 wartosc_sr_trw_per_capita zatr_przem_bud podm_gosp_na_10tys_ludn proc_ludn_wiek_prod ludnosc_na_km2, fe

Fixed-effects (within) regression               Number of obs      =       594
Group variable: id                              Number of groups   =        66

R-sq:  within  = 0.4427                         Obs per group: min =         9
       between = 0.3479                                        avg =       9.0
       overall = 0.2365                                        max =         9

                                                F(6,522)           =     69.10
corr(u_i, Xb)  = -0.9961                        Prob > F           =    0.0000

-------------------------------------------------------------------------------------------
                  st_bezr |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
--------------------------+----------------------------------------------------------------
                    sse01 |  -1.406066   .4631984    -3.04   0.003    -2.316028   -.4961045
wartosc_sr_trw_per_capita |  -.0000963   .0000166    -5.79   0.000    -.0001289   -.0000636
           zatr_przem_bud |  -26.11989   4.992198    -5.23   0.000    -35.92716   -16.31263
  podm_gosp_na_10tys_ludn |  -.0201788   .0030788    -6.55   0.000    -.0262273   -.0141304
      proc_ludn_wiek_prod |  -229.1996   16.92631   -13.54   0.000    -262.4516   -195.9475
           ludnosc_na_km2 |   .0790167   .0120865     6.54   0.000     .0552726    .1027609
                    _cons |   161.9786   10.76989    15.04   0.000      140.821    183.1363
--------------------------+----------------------------------------------------------------
                  sigma_u |  53.986519
                  sigma_e |  2.5446248
                      rho |  .99778327   (fraction of variance due to u_i)
-------------------------------------------------------------------------------------------
F test that all u_i=0:     F(65, 522) =    27.09             Prob > F = 0.0000
charlie9207
fonte

Respostas:

12

Para os comandos Stata nesta resposta, deixe-me coletar suas variáveis ​​em um local:
local xlist sse01 wartosc_sr_trw_per_capita zatr_przem_bud podm_gosp_na_10tys_ludn proc_ludn_wiek_prod ludnosc_na_km2
Então agora você sempre pode chamar todas as variáveis ​​com `xlist '

1) Existem dois comandos que você pode usar após a regressão de efeitos fixos.

  • xttest2realiza um teste de Breusch-Pagan LM com a hipótese nula de não dependência entre os resíduos. Este é um teste para correlação contemporânea. Não rejeitar o nulo significa que o teste não detectou nenhuma dependência transversal em seus resíduos.
  • xttest3realiza uma versão modificada do teste de Wald para heterocedasticidade em grupo. A hipótese nula é a homoscedasticidade.

Você pode instalar os dois comandos digitando ssc instal xttest2e ssc instal xttest3. Se você detectar correlações entre seus resíduos, poderá corrigi-lo com a opção robusta:
xtreg st_bezr 'xlist', fe robust

Para testar a autocorrelação, você pode aplicar um teste de Lagrange Multiplicador via xtserial:
xtserial st_bezr 'xlist'
A hipótese nula não é uma correlação serial. Para corrigir a correlação serial e a heterocedasticidade, você pode usar a opção de cluster com sua variável de ID:
xtreg st_bezr 'xlist', fe cluster(id)

2) Para o teste de normalidade para os resíduos: você pode obter os resíduos através do comando de previsão predict res, eapós a regressão de efeitos fixos. Para inspeção visual, você pode usar:

  • kdensity res, normal (plota a distribuição dos resíduos e a compara com uma normal)
  • pnorm res (plota um gráfico de probabilidade normal padronizada)
  • qnorm res (representa os quantis dos resíduos contra os quantis de uma distribuição normal)

Com o pnorm, você pode ver se há não normalidade no meio da distribuição e o qnorm mostra alguma não normalidade no rabo. Um teste formal pode ser obtido por swilk res. A hipótese nula é que os resíduos são normalmente distribuídos. Geralmente, a não normalidade não é uma preocupação muito grande, mas é importante para inferir. Você pode corrigir isso novamente com a opção robusta.

corr(u_i, Xb) = -0.9961vocêEuXβ

4) Geralmente sim, mas depende do que você deseja estimar ou como você pode tratar seus dados, ou seja, se suas variáveis ​​são variáveis ​​aleatórias ou não. Aqui está uma excelente explicação para a diferença entre efeitos mistos e modelos de dados em painel do @mpiktas, o que certamente o ajudará.

Andy
fonte