Existem algumas diferenças terminológicas em que a mesma coisa é chamada de nomes diferentes em diferentes disciplinas:
- Dados longitudinais em bioestatística são observações repetidas dos mesmos indivíduos = dados em painel em econometria.
- O modelo para uma variável dependente binária na qual a probabilidade de 1 é modelada como é chamado de modelo logit em econometria e modelo logístico em bioestatística. Os bioestatísticos tendem a trabalhar com a regressão logística em termos de odds ratio, já que seus s são frequentemente binários, de modo que os odds ratio representam as frequências relativas do resultado de interesse nos dois grupos da população. Essa é uma interpretação tão comum que você frequentemente verá uma variável contínua transformada em duas categorias (pressão arterial baixa versus pressão alta) para facilitar essa interpretação.x1 / ( 1 + exp[ - x′β] )x
- As "equações de estimativa" dos estatísticos são as "condições de momento" dos econométricos. As estimativas estatísticos são estimadores extremos dos economistas.M
Existem diferenças terminológicas em que o mesmo termo é usado para significar coisas diferentes em diferentes disciplinas:
- Efeitos fixos representam o na equação de regressão para estatísticos ANOVA, e um estimador "dentro" para econométricos.x′β
- Inferência robusta significa erros padrão corrigidos por heterocedasticidade para economistas (com extensões para erros padrão em cluster e / ou erros padrão corrigidos por autocorrelação) e métodos robustos a valores extremos para estatísticos.
- Parece que os economistas têm uma idéia ridícula de que amostras estratificadas são aquelas nas quais as probabilidades de seleção variam entre as observações. Estes devem ser chamados de amostras de probabilidades desiguais. Amostras estratificadas são aquelas em que a população é dividida em grupos predefinidos de acordo com características conhecidas antes da amostragem.
- A "mineração de dados" dos economometristas (pelo menos na literatura da década de 1980) costumava significar vários testes e armadilhas relacionadas a ele, que foram maravilhosamente explicadas no livro de Harrell . Os procedimentos de mineração de dados de cientistas da computação (e estatísticos) são métodos não paramétricos de encontrar padrões nos dados, também conhecidos como aprendizado estatístico .
Eu vejo as contribuições únicas da econometria a serem
- Maneiras de lidar com endogeneidade e modelos de regressão mal especificados, reconhecendo, como mpiktas explicou em outra resposta , que (i) as variáveis explicativas podem ser aleatórias (e, portanto, correlacionadas com erros de regressão que produzem viés nas estimativas de parâmetros), (ii) a os modelos podem sofrer de variáveis omitidas (que se tornam parte do termo do erro); (iii) pode haver heterogeneidade não observada de como os agentes econômicos reagem aos estímulos, complicando os modelos de regressão padrão. Angrist & Pischke é uma revisão maravilhosa dessas questões, e os estatísticos aprenderão muito sobre como fazer a análise de regressão. No mínimo, os estatísticos devem aprender e entender a regressão das variáveis instrumentais.
- De maneira mais geral, os economistas querem fazer o mínimo de suposições possível sobre seus modelos, para garantir que suas descobertas não dependam de algo tão ridículo quanto a normalidade multivariada. É por isso que GMM é muito popular entre os economistas, e nunca pego em estatísticas (mesmo que foi descrito como mínimo por Ferguson no final de 1960). É por isso que a adoção da probabilidade empírica cresceu exponencialmente na econometria, com apenas alguns seguidores nas estatísticas. É por isso que os economistas executam sua regressão com erros padrão "robustos" e estatísticos, com os erros padrão do OLS .s 2 ( X ′ X ) - 1χ2s2(X′X)−1
- Há muito trabalho no domínio do tempo com processos espaçados regularmente - é assim que os dados macroeconômicos são coletados. As contribuições únicas incluem processos integrados e cointegrados e métodos de heterocedasticidade condicional autoregressiva ((G) ARCH). Sendo geralmente uma micro pessoa, estou menos familiarizado com isso.
No geral, os economistas tendem a procurar uma forte interpretação dos coeficientes em seus modelos. Os estatísticos adotariam um modelo logístico como uma maneira de obter a probabilidade do resultado positivo, geralmente como um simples dispositivo preditivo, e também podem observar a interpretação do GLM com boas propriedades familiares exponenciais que possui, bem como conexões com análises discriminantes. Os economistas pensariam na interpretação da utilidade do modelo logit e ficariam preocupados com o fato de que apenas seja identificado nesse modelo, e com a heterocedasticidade que pode desencorajá-lo. (Os estatísticos se perguntam o queσβ/σσ são os economistas que estão falando, é claro.) É claro que uma utilidade linear em suas entradas é uma coisa muito engraçada da perspectiva da Microeconomia 101, embora algumas generalizações para funções semi-côncavas provavelmente sejam feitas em Mas-Collel.
O que os economistas geralmente tendem a perder, mas o IMHO se beneficiaria, são aspectos da análise multivariada (incluindo modelos de variáveis latentes como uma maneira de lidar com erros de medição e vários proxies ... os estatísticos também ignoram esses modelos) , diagnóstico de regressão (todas essas distâncias de Cook, MallowsCp, DFBETA, etc.), análise de dados ausentes (a identificação parcial de Manski é certamente sofisticada, mas o colapso do MCAR / MAR / NMAR e a imputação múltipla são mais úteis) e estatísticas da pesquisa. Muitas outras contribuições das estatísticas convencionais foram recebidas pela econometria e adotadas como uma metodologia padrão ou passadas de maneira a curto prazo: os modelos ARMA da década de 1960 provavelmente são mais conhecidos na econometria do que na estatística, como alguns programas de pós-graduação nas estatísticas, pode deixar de oferecer um curso de séries temporais nos dias de hoje; os estimadores de encolhimento / regressão da cordilheira dos anos 70 chegaram e se foram; o bootstrap dos anos 80 é uma reação instintiva para qualquer situação complicada, embora os economistas precisem estar mais cientes das limitações do bootstrap; a probabilidade empírica dos anos 90 viu mais desenvolvimento da metodologia dos economistas teóricos do que dos estatísticos teóricos; Os métodos Bayesianos computacionais dos anos 2000 estão sendo entretidos na econometria, mas meu sentimento é de que são paramétricos demais, baseados em modelos muito pesados, para serem compatíveis com o paradigma de robustez que mencionei anteriormente. Se os economistas encontrarão algum uso do aprendizado estatístico / bioinformática ou material espaço-temporal que é extremamente quente nas estatísticas modernas é uma decisão aberta.
É melhor explicar em termos de regressão linear, pois é a principal ferramenta da econometria. Na regressão linear, temos um modelo:
Outra maneira de observar a diferença é que os dados em outros campos estatísticos podem ser considerados como uma amostra de IDI. Em econometria, os dados em muitos casos são uma amostra do processo estocástico, do qual o iid é apenas um caso especial. Daí novamente um jargão diferente.
Saber o que foi dito acima costuma ser suficiente para saltar facilmente de outros campos estatísticos para a econometria. Como geralmente o modelo é fornecido, não é difícil descobrir o que é o quê. Na minha opinião pessoal, a diferença de jargão entre aprendizado de máquina e estatística clássica é muito maior do que entre econometria e estatística clássica.
Observe, porém, que existem termos que têm significado complicado nas estatísticas sem a econometria. O exemplo principal é efeitos fixos e aleatórios. Os artigos da Wikipedia sobre esses termos são uma bagunça, misturando econometria com estatísticas.
fonte
Uma diferença sutil é que os economistas às vezes atribuem significado aos termos de erro nos modelos. Isso é especialmente verdadeiro entre economistas "estruturais" que acreditam que você pode estimar parâmetros estruturais que representam interesse ou heterogeneidade individual.
Um exemplo de classe disso é o probit. Embora os estatísticos geralmente sejam agnósticos sobre o que causa o termo de erro, os economistas freqüentemente veem os termos do erro nas regressões como representando heterogeneidade de preferências. Para o caso probit, você pode modelar a decisão de uma mulher de ingressar na força de trabalho. Isso será determinado por uma variedade de variáveis, mas o termo do erro representará um grau não observado para o qual as preferências individuais para o trabalho podem variar.
fonte
Obviamente, qualquer declaração ampla deve ser excessivamente ampla. Mas minha experiência foi de que a econometria está preocupada com relações causais e as estatísticas se interessaram mais pela previsão.
No lado da economia, você não pode evitar a literatura da "revolução da credibilidade" ( Econometria Principalmente Inofensiva , etc.). Os economistas estão focados no impacto de algum tratamento em algum resultado, visando a avaliação e recomendação de políticas.
No lado das estatísticas, você vê a ascensão do Data Mining / Machine Learning com aplicativos para análises e genética on-line sendo exemplos notáveis. Aqui, os pesquisadores estão mais interessados em prever comportamentos ou relacionamentos, em vez de explicá-los com precisão; eles procuram padrões, e não causas.
Eu também mencionaria que os estatísticos tradicionalmente estavam mais interessados no projeto experimental, voltando aos experimentos agrícolas na década de 1930.
fonte
Percebi que, em comparação com o que eu chamaria econometristas de ciência estatística convencional, parecem relutantes em usar gráficos, esquemáticos ou baseados em dados. A cobertura da regressão, que é naturalmente ainda mais central na econometria do que em outros lugares, é um grande caso em questão. As introduções modernas à regressão por estatísticos enfatizam o valor de plotar os dados e plotar os resultados da regressão, incluindo gráficos de diagnóstico, enquanto o tratamento nos textos econométricos é claramente mais formal. Os principais textos em econometria não incluem muitos gráficos e não promovem fortemente seu valor.
É difícil analisar isso sem o risco de parecer não-somático ou pior, mas eu acho que alguma combinação do seguinte é contributiva.
Desejo de rigor. Os econométricos tendem a ser suspeitos ou hostis a aprender com os dados e preferem fortemente que as decisões sejam baseadas em testes formais (sempre que não saem de um teorema). Isso está vinculado à preferência por modelos baseados na "teoria" (embora isso possa significar apenas que um preditor foi mencionado anteriormente em um artigo por algum economista que não fala sobre dados).
Práticas de publicação. Os artigos para revistas de economia ou econometria são pesados, com tabelas de coeficientes altamente estilizados, erros padrão, estatísticas t e valores-P. A adição de gráficos nem parece ser considerada em muitos casos e, se oferecida, seria sugerida para corte pelos revisores. Essas práticas foram incorporadas ao longo de uma geração ou mais, na medida em que se tornaram automáticas, com convenções rígidas sobre os níveis de significância, etc.
Gráficos para modelos complexos. Os gráficos tácitos são ignorados sempre que não parece que exista um gráfico que corresponda a um modelo complexo com muitos preditores, etc., etc. (o que geralmente é difícil de decidir).
Naturalmente, o que estou sugerindo é uma diferença de meios, por assim dizer, e reconheço muita variabilidade nos dois casos.
fonte
Ao contrário da maioria das outras disciplinas quantitativas, a economia lida com as coisas da MARGIN. Ou seja, utilidade marginal, taxa marginal de substituição etc. Em termos de cálculo, a economia lida com "primeiro" (e derivativos de ordem superior).
Muitas disciplinas estatísticas lidam com quantidades não derivadas, como médias e variações. Obviamente, você pode entrar na área de distribuições de probabilidade marginal e condicional, mas algumas dessas aplicações também se destinam à economia (por exemplo, "valor esperado").
fonte
Não é econometria, é contexto. Se a sua função de probabilidade não tiver um ótimo único, isso envolverá um estatístico e um economista. Agora, se você propõe uma suposição que vem da teoria econômica e restringe a parametrização para que o parâmetro seja identificado, isso pode ser chamado de econometria, mas a suposição poderia ter vindo de qualquer campo substantivo.
Exogeneidade é uma questão filosófica. Veja, por exemplo, http://andrewgelman.com/2009/07/disputes_about/ para uma comparação de diferentes pontos de vista, onde os economistas geralmente o entendem da mesma maneira que Rubin.
Portanto, em resumo, adote o jargão que seu professor usa ou mantenha a mente aberta e leia amplamente.
fonte
Econometristas estão quase exclusivamente interessados em inferência causal, enquanto estatísticos também usam modelos para prever resultados. Como resultado, os economistas se concentram mais na exogeneidade (como outros já mencionaram). Econométricos de forma reduzida e econométricos estruturais obtêm essas interpretações causais de diferentes maneiras.
Econométricos de forma reduzida freqüentemente lidam com a exogeneidade usando técnicas de variáveis instrumentais (enquanto IV é usado com muito menos frequência pelos estatísticos).
Os econométricos estruturais obtêm interpretações causais de parâmetros, baseando-se em uma quantidade de teoria rara no trabalho de estatísticos.
fonte
Como estatístico, penso nisso em termos mais gerais. Temos biometria e econometria. Essas são as duas áreas em que as estatísticas são usadas para resolver problemas. Com a biometria, estamos lidando com problemas biológicos / médicos, enquanto a econometria lida com a economia. Caso contrário, eles seriam os mesmos, exceto que diferentes disciplinas enfatizam diferentes técnicas estatísticas. Na análise biométrica, a análise de sobrevivência e a tabela de contingência são muito utilizadas. Para econometria, as séries temporais são muito usadas. A análise de regressão é comum a ambos. Tendo visto as respostas sobre as diferenças de terminologia entre economatria e bioestatística, parece que a pergunta real era principalmente sobre terminologia e eu realmente apenas lidei com as outras duas. As respostas são tão boas que não posso acrescentar nada. Gostei particularmente das respostas do StasK. Mas, como bioestatístico, acho que usamos o modelo logit e o modelo logístico de forma intercambiável. Chamamos log (p / [1-p]) da transformação de logit.
fonte