Eu tenho um modelo econômico teórico que é o seguinte,
Então a teoria diz que existem , e fatores para estimar .
Agora eu tenho os dados reais e preciso estimar , , . O problema é que o conjunto de dados real contém apenas dados para e ; não há dados para . Portanto, o modelo em que posso encaixar é:
- Tudo bem estimar esse modelo?
- Perco alguma coisa estimando isso?
- Se eu estimar , , para onde vai o termo ?
- É explicado pelo termo de erro ?
E gostaríamos de assumir que não está correlacionado com e .
Respostas:
O problema com o qual você precisa se preocupar é chamado de endogeneidade . Mais especificamente, depende se está correlacionado na população com x 1 ou x 2 . Se for, os b j s associados serão enviesados. Isso é porque MQO métodos de regressão forçar os resíduos, u i , para ser não correlacionado com os seus co-variáveis, x j s. No entanto, os resíduos são compostas de alguma aleatoriedade irredutível, ε i , e a variável não observada (mas relevante), x 3 , que por estipulaçãox3 x1 x2 bj ui xj εi x3 está correlacionado com e / ou x 2 . Por outro lado, se ambos x 1 e x 2 são não correlacionadas com x 3 na população, então o seu b s não será influenciada por isso (que pode muito bem ser tendencioso por outra coisa, é claro). Uma maneira pela qual os economistas tentam lidar com esse problema é usando variáveis instrumentais . x1 x2 x1 x2 x3 b
Para maior clareza, escrevi uma simulação rápida em R que demonstra que a distribuição amostral de é imparcial / centrada no valor real de β 2 , quando não está correlacionado com x 3 . Na segunda execução, no entanto, observe que x 3 não está correlacionado com x 1 , mas não x 2 . Não por coincidência, b 1 é imparcial, mas b 2 é tendencioso.b2 β2 x3 x3 x1 x2 b1 b2
fonte
Vamos pensar nisso em termos geométricos. Pense em uma "bola", a superfície de uma bola. É descrito como . Agora, se você possui os valores de x 2 , y 2 , z 2 e tem medidas de r 2 , pode determinar seus coeficientes "a", "b" e "c". (Você pode chamá-lo de elipsóide, mas chamá-lo de bola é mais simples.)r2=ax2+by2+cz2+ϵ x2 y2 z2 r2
Se você tiver apenas os termos e y 2 , poderá fazer um círculo. Em vez de definir a superfície de uma bola, você descreverá um círculo preenchido. A equação que você ajustou é r 2 ≤ a x 2 + b y 2 + ϵ .x2 y2 r2≤ax2+by2+ϵ
Você está projetando a "bola", qualquer que seja a forma, na expressão do círculo. Pode ser uma "bola" orientada na diagonal que tem o formato mais parecido com uma agulha de costura e, portanto, os componentes destroem completamente as estimativas dos dois eixos. Pode ser uma bola que parece um m & m quase esmagado, onde os eixos das moedas são "x" e "y", e não há projeção zero. Você não pode saber qual é sem a informação " z ".z z
Esse último parágrafo estava falando sobre um caso de "informação pura" e não explicava o barulho. As medições do mundo real têm o sinal com ruído. O ruído ao longo do perímetro alinhado aos eixos terá um impacto muito mais forte no seu ajuste. Mesmo que você tenha o mesmo número de amostras, você terá mais incerteza nas estimativas de parâmetros. Se for uma equação diferente desse caso simples orientado a eixo linear, as coisas podem ficar " em forma de pêra ". Suas equações atuais são em forma de plano; portanto, em vez de ter um limite (a superfície da bola), os dados z podem percorrer todo o mapa - a projeção pode ser um problema sério.
Está tudo bem em modelar? Essa é uma decisão judicial. Um especialista que entende os detalhes do problema pode responder a isso. Não sei se alguém pode dar uma boa resposta se estiver longe do problema.
Você perde várias coisas boas, incluindo a certeza nas estimativas de parâmetros e a natureza do modelo que está sendo transformado.
fonte
As outras respostas, embora não estejam erradas, complicam um pouco a questão.
fonte