É possível executar uma regressão em que você possui uma variável de recurso desconhecida / desconhecida?

7

É possível executar uma regressão em que você possui uma variável de recurso desconhecida / desconhecida?

Diga que eu tenho yn=a0+a1x1+a2x2+a3x3 mas eu não / não posso medir o valor da variável do recurso x3. Ainda posso realizar uma regressão para verificar os coeficientesai?

Que tal se eu tiver algum conhecimento das estatísticas de como x3é distribuído? Se eu souber dissox3 é extraído de uma distribuição gaussiana N(0,σ2), com conhecidos σ isso me permite executar a regressão para verificar os valores de ai?

SomeRandomPhysicist
fonte
4
Não, como você saberia o que é atribuível ao recurso e o que é aleatório?
user2974951
7
Se fosse possível, o mundo seria lindo! Imagine: sem coleta de dados! sem disputas de dados! Ninguém lhe enviando dados como imagem embeded no documento do Word ...
Łukasz Deryło
Obrigado pelas respostas, só queria alguma confirmação de que era esse o caso, como eu suspeitava. Acho que ainda é possível realizar a regressão nas outras variáveis ​​de recurso se o efeito dex3era muito fraco em relação às outras variáveis ​​de recurso e, portanto, poderia ser totalmente negligenciado, mas no caso em que há uma grande contribuição, a regressão é impossível.
SomeRandomPhysicist
@ user2974951 Por que não transformar isso em resposta? Eu nem acho que você precisaria expandir isso.
mkt - Restabelece Monica
Que tal um modelo de espaço de estado?
Chris Haug

Respostas:

13

A fórmula completa para um modelo linear é (na forma de quase matriz)

Y=βX+ϵ

Portanto, temos vários coeficientes para as variáveis ​​que estamos controlando e, em seguida, temos ϵ, que é tudo o mais que não explicamos com nossas variáveis ​​incluídas.

Nesse termo de erro, pertencem todas as variáveis ​​que não consideramos, porque não temos informações para elas ou porque simplesmente não as conhecemos (desvio aleatório).

Portanto, não há como você saber o que neste termo pertence ao termo desconhecido.

user2974951
fonte
11
Promovido pela excelência e clareza da resposta.
James Phillips
3

Que tal se eu tiver algum conhecimento das estatísticas de como o x3 é distribuído?

Se você fizer a regressão de y em x1 e x2, se você deseja adivinhar como x3 se correlaciona com cada uma delas, é possível calcular o que essas suposições implicariam para como os coeficientes estimados mudariam se você pudesse observar x3 e executou a regressão completa.

Suponha, por exemplo, que x3 não está correlacionado com x1. Então

α2,your regression=α2,full regression+α3cov(x3,x2)var(x2)

Então se x3 é provável que esteja apenas fracamente correlacionado com y ou x1 e x2pouco mudaria. E, se for, você pode usar essas fórmulas de viés de variável omitida para prever como as coisas mudariam.

CloseToC
fonte
0

É sempre possível ... mas suas estimativas serão tendenciosas em muitos casos. O caso mais favorável ocorre:
(a) quandox3n não está correlacionado com os outros regressores, neste caso, regride yn em (ι,x1,x2) e você tem estimativas imparciais de a0,a1,a2(Teorema de Frish-Waugh-Lovell)
(b) Se, além de (a) você sabeσ e x3N(0,σ2), você pode até identificar a3: desenhar N valores de iid para x3nN(0,σ2) e regredir yn em (ι,x1,x2,x3).

Bertrand
fonte
Você poderia explicar melhor como executar a regressão na situação (b)? Você gera valores para o desconhecidox3 desenhando-os de N(0,σ2)e depois regredir nisso?
SomeRandomPhysicist
Sim, é assim que se faz. É possível iterar na geração e estimativa aleatória de números, mas isso não parece interessante no seu caso simples. Existe uma literatura crescente sobre métodos baseados em simulação usando uma abordagem semelhante, mas eles são um pouco mais envolvidos do que no seu exemplo: veja Gouriéroux e Monfort, por exemplo. Veja também a descrição pedagógica no texbook de Cameron e Trivedi (2005).
Bertrand