Por que a variação de 2SLS é maior que a do OLS?

9

Outro problema potencial com a aplicação do 2SLS e outros procedimentos IV é que os erros padrão do 2SLS tendem a ser '' grandes ''. O que normalmente significa essa declaração é que os coeficientes 2SLS são estatisticamente insignificantes ou que o padrão 2SLS erros são muito maiores que os erros padrão do OLS. Não é de surpreender que as magnitudes dos erros padrão do 2SLS dependam, entre outras coisas, da qualidade do (s) instrumento (s) usado (s) na estimativa.

Esta citação é da "Análise econométrica de Wooldridge de dados transversais e em painel" . Eu me pergunto por que isso acontece? Eu preferiria uma explicação matemática.

Assumindo a homosedasticidade por simplicidade, a variação assintótica (estimada) do estimador OLS é dada por enquanto para o estimador 2SLS que

\hat{A v a r} ({\hat{β}}_{O L S}) = n σ^{2} (X^{'} X)^{- 1}

$\widehat{Avar}(\hat{\beta}_{OLS}) = n\sigma^2(X'X)^{-1}$

\hat{A v a r} ({\hat{β}}_{2 S L S}) = n σ^{2} ({\hat{X}}^{'} \hat{X})^{- 1}

$\widehat{Avar}(\hat{\beta}_{2SLS}) = n\sigma^2(\hat{X}'\hat{X})^{-1}$

\hat{X} = P_{z} X = Z (Z^{'} Z)^{- 1} Z^{'} X .

$\hat{X} = P_zX = Z(Z'Z)^{-1}Z'X.$

$X$ é a matriz de regressores, incluindo os endógenos, e é a matriz de variáveis instrumentais. $Z$

Portanto, reescrever a variação para 2SLS fornece

\hat{A v a r} ({\hat{β}}_{2 S L S}) = n σ^{2} {(X^{'} Z (Z^{'} Z)^{- 1} Z^{'} X)}^{- 1} .

$\widehat{Avar}(\hat{\beta}_{2SLS}) = n\sigma^2\left(X'Z(Z'Z)^{-1}Z'X\right)^{-1}.$

No entanto, não posso concluir das fórmulas acima que . $\widehat{Avar}(\hat{\beta}_{2SLS}) \geq \widehat{Avar}(\hat{\beta}_{OLS})$

self-study variance least-squares instrumental-variables tosik
fonte

Eu acho que você esqueceu de tomar o inverso em sua última expressão de Avar de 2SLS.

Richard Hardy

Você está certo, corrigido.

Tosik

Eu fiz algumas pequenas edições, nomeadamente em relação à definição de . Por favor, verifique.

Z

$Z$

Christoph Hanck 28/10

6

Dizemos que uma matriz é pelo menos tão grande quanto se a diferença for semidefinida positiva (psd). $A$ $B$ $A-B$

Uma declaração equivalente que acaba sendo mais fácil de verificar aqui é que é psd (assim como é equivalente a ). $B^{-1}-A^{-1}$ $a>b$ $1/b>1/a$

Então, queremos verificar se é psd.

X^{'} X - X^{'} Z (Z^{'} Z)^{- 1} Z^{'} X

$X'X-X'Z(Z'Z)^{-1}Z'X$

Escreva Para verificar se é psd, devemos mostrar que, para qualquer vetor , Seja . Então, como é uma matriz de projeção simétrica e idempotente, conhecida por psd: write, usando simetria e idempotência, e deixe , de modo que , que, sendo uma soma de quadrados, deve ser não negativo.

X^{'} X - X^{'} Z (Z^{'} Z)^{- 1} Z^{'} X = X^{'} (I - Z (Z^{'} Z)^{- 1} Z^{'}) X = X^{'} M_{Z} X

$X'X-X'Z(Z'Z)^{-1}Z'X=X'(I-Z(Z'Z)^{-1}Z')X=X'M_ZX$

X^{'} M_{Z} X

$X'M_ZX$

d

$d$

d^{'} X^{'} M_{Z} X d \geq 0

$d'X'M_ZXd\geq0$

c = X d

$c=Xd$

c^{'} M_{Z} c \geq 0

$c'M_Zc\geq0$

M_{Z}

$M_Z$

c^{'} M_{Z} c = c^{'} M_{Z} M_{Z} c = c^{'} M_{Z}^{'} M_{Z} c

$c'M_Zc=c'M_ZM_Zc=c'M_Z'M_Zc$

e = M_{Z} c

$e=M_Zc$

c^{'} M_{Z} c = e^{'} e = \sum_{i} e_{i}^{2}

$c'M_Zc=e'e=\sum_ie_i^2$

PS: Duas pequenas queixas - você se refere às variações assintóticas estimadas . Agora, o estimador OLS e o estimador 2SLS de não são os mesmos, de modo que não vejo que o ranking deva necessariamente ser preservado se essas estimativas diferirem. Além disso, as variações assintóticas são geralmente escalonadas por , a fim de obter uma quantidade não-regenerada como . (É claro que escalar ambos por não afetará a classificação, de modo que o problema é um pouco discutível para essa questão em particular.) $\widehat{Avar}(\hat\beta_j)$ $\sigma^2$ $n$ $n\to\infty$ $n$

Christoph Hanck
fonte

Muito obrigado pela sua resposta. De fato, a variação assintótica deve ser dividida por (corrigida). Eu acho que há um erro de digitação quando você chama a matriz de projeção , acho que é chamada matriz do aniquilador. De qualquer forma, você pode fornecer detalhes sobre por que é psd. Também não entendo bem o seu ponto de vista de que os estimadores OLS e 2SLS para não são os mesmos. Você poderia elaborar o que isso significa?

n

$n$

M_{z}

$M_z$

M_{z}

$M_z$

σ^{2}

$\sigma^2$

Tosik

Eu adicionei alguns detalhes. é realmente mais conhecido como matriz aniquiladora, mas como também se projeta em algum espaço (o complemento ortogonal da imagem de ), também é uma matriz de projeção.

M

$M$

P

$P$

Christoph Hanck 28/10

Obrigado pelo esclarecimento e pelas edições (não sei por que decidi dividir por ). Você poderia explicar seu primeiro ponto no PS?

n

$n$

tosik 28/10

Para realmente torná-la a variação assintótica estimada , você precisaria de algum estimador . O estimador OLS de é baseado nos resíduos OLS, enquanto o estimador 2SLS usa resíduos para estimar . Essas estimativas podem diferir, em qualquer direção, possivelmente afetando a classificação das variações.

{\hat{σ}}^{2}

$\hat\sigma^2$

σ^{2}

$\sigma^2$

y - X {\hat{β}}_{2 S L S}

$y-X\hat\beta_{2SLS}$

σ^{2}

$\sigma^2$

Christoph Hanck 28/10

3

Acho que esse é um daqueles momentos em que é muito mais fácil olhar para uma simples equação, uma configuração de variável. Então, tecnicamente, isso é regressão IV e não 2SLS (mas o resultado ainda é geral). Então, vamos asume um modelo (usando a notação Wooldridge), para alguns temos: $i$

y_{i} = β_{0} + β_{1} x_{i 1} + u_{i}

$y_i = \beta_0 + \beta_1 x_{i1} + u_i$

Agora, se assumirmos que esse modelo segue as premissas de Gauss-Markov, sabemos (veja qualquer livro decente) que a variação assintótica de é dada por: $\hat\beta_1$

A v a r ({\hat{β}}_{O L S}) = \frac{{\hat{σ}}^{2}}{S S T_{x}}

$Avar(\hat\beta_{OLS})=\frac{\hat\sigma^2}{SST_x}$

Onde é a soma total de quadrados para . Se, em vez disso, assumimos que é (possível) endegonoues e usamos regressão IV com como instrumento, a variação assintótica do estimador IV é: $SST_x$ $x$ $x$ $z$

A v a r ({\hat{β}}_{i v}) = \frac{{\hat{σ}}^{2}}{S S T_{x} \cdot R_{x, z}^{2}}

$Avar(\hat\beta_{iv}) = \frac{\hat\sigma^2}{SST_x \cdot R^2_{x,z}}$

Como está sempre entre e , deve ser o caso em que o denominador para o estimador IV é menor que o OLS (se OLS for realmente válido). $R^2$ $0$ $1$

Repmat
fonte

0

Apenas um comentário. Eu acho que é bastante claro que a estimativa da variação dos erros é maior quando se usa 2SLS. Lembre-se de que o OLS minimiza a estimativa dessa variação. Portanto, qualquer outro estimador deve ter uma estimativa amostral mais alta da variação dos erros.

Paulo
fonte

Por que a variação de 2SLS é maior que a do OLS?

Respostas: