Meu professor de econometria usou o termo "identificado" na aula. Estamos considerando processos de geração de dados no formato que é uma variável aleatória e é um termo de erro aleatório. Nossas linhas de regressão assumem a forma de
Ele deu a seguinte definição de "identificado":
, são identificados se um conjunto de dados contiver informações suficientes para "definir" valores únicos para ,
Estou insatisfeito com esta definição porque ele não especifica o que é "informação" nem o que "pin down" significa.
Um pouco de contexto
Em um de nossos exercícios, recebemos . Segundo meu professor, isso viola uma suposição chamada "Exogeneidade", necessária para que um modelo seja 'identificável'.
Especificamente, de acordo com suas notas de aula,
Exogeneidade Assunção: O termo de erro é não correlacionadas com os regressores, ou para todo . Assumindo , isso pode ser reescrito como para todos
Parece que no nosso problema, ele está tentando nos fazer entender por que, se essa suposição de Exogeneidade falha, um modelo não pode ser identificado. Portanto, esperamos que isso possa dar contexto aos respondentes sobre como ele está usando o termo.
Minha pergunta
Alguém pode esclarecer o que ele quer dizer com "informação" e "definir"? Ou dê uma definição melhor por completo.
EDITAR:
Retirado da Wikipedia:
Observacionalmente Equivalente --- dois valores de parâmetros são considerados observacionalmente equivalentes se ambos resultarem na mesma distribuição de probabilidade dos dados observáveis.
Identificado --- qualquer situação em que um modelo estatístico invariavelmente tenha mais de um conjunto de parâmetros que geram a mesma distribuição de observações, significando que várias parametrizações são observacionalmente equivalentes.
Isso ainda não explica realmente de onde vem a "exogeneidade" e por que está relacionada a ser "identificada".
fonte
Respostas:
Identificabilidade refere-se basicamente à existência ou não de estimadores consistentes para os parâmetros do modelo. Dito de outra forma, se nos dizem a distribuição dos dados, podemos recuperar os parâmetros do modelo? Caso contrário, nosso modelo não é identificável.
Talvez o exemplo mais simples de um modelo não identificável seja o modelo ANOVA super-parametrizado. Este modelo assume a forma
onde e são constantes arbitrárias e normal . Se as informações que normal para alguns conjuntos de constantes e , e é importante observar que isso é tudo o que podemos aprender com os dados; então, não há uma maneira única de traduzir isso de volta para constantes , e . Isto é porque nós sempre pode tomar eμ {αi}ki=1 ϵij∼ (0,σ2) Yij∼ (μi,σ2) {μi}ki=1 σ2 μ {αi}ki=1 σ2 μ+c αi−c para chegar ao mesmo parâmetro médio para diferentes valores dos parâmetros do modelo. Mesmo se tivéssemos dados infinitos, nunca poderíamos esperar recuperar esses valores. Por esse motivo, impomos a restrição que garante um mapeamento um a um entre o modelo e os parâmetros de distribuição.μi=μ+αi ∑ki=1αi=0
fonte