Por que a variação de 2SLS é maior que a do OLS?

9

Outro problema potencial com a aplicação do 2SLS e outros procedimentos IV é que os erros padrão do 2SLS tendem a ser '' grandes ''. O que normalmente significa essa declaração é que os coeficientes 2SLS são estatisticamente insignificantes ou que o padrão 2SLS erros são muito maiores que os erros padrão do OLS. Não é de surpreender que as magnitudes dos erros padrão do 2SLS dependam, entre outras coisas, da qualidade do (s) instrumento (s) usado (s) na estimativa.

Esta citação é da "Análise econométrica de Wooldridge de dados transversais e em painel" . Eu me pergunto por que isso acontece? Eu preferiria uma explicação matemática.

Assumindo a homosedasticidade por simplicidade, a variação assintótica (estimada) do estimador OLS é dada por enquanto para o estimador 2SLS que

Avar^(β^OLS)=nσ2(XX)1
Avar^(β^2SLS)=nσ2(X^X^)1
X^=PzX=Z(ZZ)1ZX.

X é a matriz de regressores, incluindo os endógenos, e é a matriz de variáveis ​​instrumentais.Z

Portanto, reescrever a variação para 2SLS fornece

Avar^(β^2SLS)=nσ2(XZ(ZZ)1ZX)1.

No entanto, não posso concluir das fórmulas acima que .Avar^(β^2SLS)Avar^(β^OLS)

tosik
fonte
Eu acho que você esqueceu de tomar o inverso em sua última expressão de Avar de 2SLS.
Richard Hardy
Você está certo, corrigido.
Tosik
Eu fiz algumas pequenas edições, nomeadamente em relação à definição de . Por favor, verifique. Z
Christoph Hanck 28/10

Respostas:

6

Dizemos que uma matriz é pelo menos tão grande quanto se a diferença for semidefinida positiva (psd).ABAB

Uma declaração equivalente que acaba sendo mais fácil de verificar aqui é que é psd (assim como é equivalente a ).B1A1a>b1/b>1/a

Então, queremos verificar se é psd.

XXXZ(ZZ)1ZX

Escreva Para verificar se é psd, devemos mostrar que, para qualquer vetor , Seja . Então, como é uma matriz de projeção simétrica e idempotente, conhecida por psd: write, usando simetria e idempotência, e deixe , de modo que , que, sendo uma soma de quadrados, deve ser não negativo.

XXXZ(ZZ)1ZX=X(IZ(ZZ)1Z)X=XMZX
XMZXd
dXMZXd0
c=Xd
cMZc0
MZ
cMZc=cMZMZc=cMZMZc
e=MZccMZc=ee=iei2

PS: Duas pequenas queixas - você se refere às variações assintóticas estimadas . Agora, o estimador OLS e o estimador 2SLS de não são os mesmos, de modo que não vejo que o ranking deva necessariamente ser preservado se essas estimativas diferirem. Além disso, as variações assintóticas são geralmente escalonadas por , a fim de obter uma quantidade não-regenerada como . (É claro que escalar ambos por não afetará a classificação, de modo que o problema é um pouco discutível para essa questão em particular.)Avar^(β^j)σ2nnn

Christoph Hanck
fonte
Muito obrigado pela sua resposta. De fato, a variação assintótica deve ser dividida por (corrigida). Eu acho que há um erro de digitação quando você chama a matriz de projeção , acho que é chamada matriz do aniquilador. De qualquer forma, você pode fornecer detalhes sobre por que é psd. Também não entendo bem o seu ponto de vista de que os estimadores OLS e 2SLS para não são os mesmos. Você poderia elaborar o que isso significa? nMzMzσ2
Tosik
Eu adicionei alguns detalhes. é realmente mais conhecido como matriz aniquiladora, mas como também se projeta em algum espaço (o complemento ortogonal da imagem de ), também é uma matriz de projeção. MP
Christoph Hanck 28/10
Obrigado pelo esclarecimento e pelas edições (não sei por que decidi dividir por ). Você poderia explicar seu primeiro ponto no PS? n
tosik 28/10
Para realmente torná-la a variação assintótica estimada , você precisaria de algum estimador . O estimador OLS de é baseado nos resíduos OLS, enquanto o estimador 2SLS usa resíduos para estimar . Essas estimativas podem diferir, em qualquer direção, possivelmente afetando a classificação das variações. σ^2σ2yXβ^2SLSσ2
Christoph Hanck 28/10
3

Acho que esse é um daqueles momentos em que é muito mais fácil olhar para uma simples equação, uma configuração de variável. Então, tecnicamente, isso é regressão IV e não 2SLS (mas o resultado ainda é geral). Então, vamos asume um modelo (usando a notação Wooldridge), para alguns temos:i

yi=β0+β1xi1+ui

Agora, se assumirmos que esse modelo segue as premissas de Gauss-Markov, sabemos (veja qualquer livro decente) que a variação assintótica de é dada por:β^1

Avar(β^OLS)=σ^2SSTx

Onde é a soma total de quadrados para . Se, em vez disso, assumimos que é (possível) endegonoues e usamos regressão IV com como instrumento, a variação assintótica do estimador IV é:SSTxxxz

Avar(β^iv)=σ^2SSTxRx,z2

Como está sempre entre e , deve ser o caso em que o denominador para o estimador IV é menor que o OLS (se OLS for realmente válido).R201

Repmat
fonte
0

Apenas um comentário. Eu acho que é bastante claro que a estimativa da variação dos erros é maior quando se usa 2SLS. Lembre-se de que o OLS minimiza a estimativa dessa variação. Portanto, qualquer outro estimador deve ter uma estimativa amostral mais alta da variação dos erros.

Paulo
fonte