Problema na identificação de parâmetros

8

Eu sempre luto para obter a verdadeira essência da identificação na econometria. Eu sei que afirmamos que um parâmetro (digamos ) pode ser identificado se, simplesmente olhando para sua distribuição (conjunta), pudermos inferir o valor do parâmetro. Em um caso simples de , onde , podemos afirmar que é identificado se soubermos que sua variância . Mas e se onde é um parâmetro desconhecido? Pode e ser identificados?θ^y=b1X+uE[u]=0,E[u|x]=0b1Var(b^)>0E[u|X]=aaab1

Se eu expandir o modelo para onde e , para mostrar que estão identificados, faça Eu simplesmente tenho que reafirmar que a variação para todos os três parâmetros é maior que zero?Y=b0+b1X+b2XD=uD{0,1}E[u|X,D]=0b1,b2,b3

Agradeço toda a ajuda em limpar minha mente com relação à identificação.

CharlesM
fonte
Foi-me dito que, para o modelo com a variável dummy, eu simplesmente tenho que mostrar que existe ... significando que os determinantes dessa matriz não são iguais a 0. Correto? [XX]1
CharlesM
Eu também postou pergunta sobre a troca de matemática e nada ....
CharlesM
Isso ajuda ou apenas mais do que você já sabe? Notas do curso da UChicago
kirk

Respostas:

3

Vamos primeiro definir os seguintes objetos: Em um modelo estatístico usado para modelar como uma função de , existem parâmetros denotados por vetor . Esses parâmetros podem variar dentro do espaço de parâmetros . Não estamos interessados ​​na estimativa de todos esses parâmetros, mas apenas de um determinado subconjunto, digamos em dos parâmetros que denotamos e que variam dentro do espaço de parâmetros . Em nosso modelo as variáveis e os parâmetrosMYXpθΘRpqpθ0Θ0RqMXθ vai agora ser mapeada como para explicar . Esse mapeamento é definido por e pelos parâmetros.YM

Nesse cenário, a identificabilidade diz algo sobre a Equivalência Observacional . Em particular, se os parâmetros forem identificáveis ​​em então ele sustentará queθ0Mθ1Θ0:θ1θ0,M(θ0)=M(θ1) . Em outras palavras, não existe um vector de parâmetros diferentes que iria induzir o mesmo processo de geração de dados, tendo em conta a especificação do modelo M . Para tornar esses conceitos mais concebíveis, dou dois exemplos.θ1M

Exemplo 1 : Defina para ; X N ( μ , σ 2 I n ) ; ε ~ N ( 0 , σ 2 e eu n ) o modelo estatístico simples H : Y = um + X b + ε e supor que ( a , b ) R 2 (de modo Θθ=(a,b)XN(μ,σ2In);εN(0,σe2In)M

Y=a+Xb+ε
(a,b)R2 ). Fica claro que, se θ 0 = ( a , b ) ou θ 0 = a , sempre será válido que θ 0 é identificável: O processo que gera Y a partir de X tem uma relação de 1 : 1 com os parâmetros a e b . Fixando ( a , b ) , não será possível encontrar uma segunda tupla em R descrevendo o mesmo Processo de Geração de Dados.Θ=R2θ0=(a,b)θ0=aθ0YX1:1ab(a,b)R

Exemplo 2 : Defina para ; X N ( μ , σ 2 I n ) ; ε N ( 0 , σ 2 e I n ) o modelo estatístico mais complicado M : Y = a + X ( bθ=(a,b,c)XN(μ,σ2In);εN(0,σe2In)M e supor que(a,b)R2ecR{0}(modoΘ=R3{(l,m,0)|(l,m)R2}). Enquanto paraθ0, esse seria um modelo estatístico identificável, não será válido se um incluir outro parâmetro (isto é,b

Y=a+X(bc)+ε
(a,b)R2cR{0}Θ=R3{(l,m,0)|(l,m)R2}θ0bou ) Por quê? Porque para qualquer par de ( b , c ) , existem infinitamente muitos outros pares no conjunto B : = { ( x , y ) | ( X / y ) = ( b / c ) , ( x , y ) R 2 } . A solução óbvia para o problema nesse caso seria a introdução de um novo parâmetro d = b / cc(b,c)B:={(x,y)|(x/y)=(b/c),(x,y)R2}d=b/csubstituindo a fração para identificar o modelo. No entanto, pode-se estar interessado em e c como parâmetros separados por razões teóricas - os parâmetros podem corresponder aos parâmetros de interesse em uma (econômico) sentido teoria. (Por exemplo, b pode ser 'propensão a consumir' e c pode ser 'confiança', e você pode querer estimar essas duas quantidades a partir do seu modelo de regressão. Infelizmente, isso não seria possível.)bcbc
Jeremias K
fonte
1
θ1
1
@ whuber que é um bom ponto. O que eu deveria ter dito é que "Não existe ... isso induziria o mesmo processo de geração de dados ". Eu mudei isso agora :)
Jeremias K