Econometria: a elasticidade é significativa em minha ou em alguma regressão?

13

Há alguns meses estagiei nesta organização; e, como presente de despedida, decidi passar minha última semana, com qualquer folga que tivesse, para investigar os fatores que afetam os salários dos professores. Um problema que tive com os salários dos professores foi que a distribuição para o estado em questão estava distorcida. Eu tive muitas observações que se agarravam à extremidade inferior do espectro salarial. Tentei resolver isso incorporando um Índice de salários comparáveis em minha variável dependente (salário dos professores), mas os resultados encontrados foram completamente desatualizados para o escopo do meu projeto. Em vez disso, decidi registrar minha variável dependente. Isso foi legal porque agora meus salários tinham uma distribuição normal e pareciam perfeitos no histograma. Quando comecei a testar, cheguei ao ponto em que fiquei com uma última variável independente, a declaração de imposto sobre a propriedade. O problema com meus salários normativos também foi aparente nas minhas observações de declaração de imposto sobre a propriedade. Eu tinha uma enorme variação nos números de declaração de imposto sobre a propriedade na extremidade inferior do espectro. Então, eu registrei essa variável também e ela ainda passou no teste de hipótese nula muito bem.

Não tenho certeza se isso está correto, mas comparando a alteração de uma variável registrada com outra variável registrada, dei-me a elasticidade. Supondo que isso esteja correto, minha equação de regressão (algo como LogWages = B0 + B1 (LogPropertyTaxReturns)) mostra a elasticidade entre as duas variáveis. Isso é significativo? Se meu objetivo era ver qual variável mais afetava os salários dos professores em qualquer município do meu estado, é útil mostrar a elasticidade entre as duas variáveis? Queremos elevar os municípios com os salários mais baixos dos professores para aumentar seus padrões de vida, mas temo extrapolar tão longe as observações reais que minha equação de regressão final não tem sentido.

Edit: Um dos meus maiores medos é que eu deveria ter usado um modelo não linear para mostrar o relacionamento. Eu sinto que forçar tanto a variável dependente quanto a independente a cooperar nessa regressão linear é enganoso de alguma forma.

econometrics elasticity wages rosenjcb
fonte

1

É absolutamente significativo. Veja a definição da elasticidade. Basicamente, você tem informações sobre a direção do relacionamento entre Salários e PropertyTaxReturns. Além disso, você tem uma medida estimada desse relacionamento. Como é Log-Log, os salários serão alterados em porcentagens de B1 por alteração de um por cento da declaração de imposto sobre a propriedade. Você pode fazer uma análise de séries temporais para confirmar. Na verdade, apenas representar graficamente os salários e a declaração do imposto sobre a propriedade ao longo do tempo seria suficiente para ver qual é o relacionamento. Isso é uma forma básica que não leva em conta variáveis ocultas e etc.

Koba

@ Koba Obrigado por comentar tão rapidamente. O problema não é que a elasticidade mude ao longo da curva? Meu maior arrependimento é que eu tenha forçado o modelo a ser linear, forçando a elasticidade a ser bastante estável. Pensando bem, poderia ter sido melhor ter um modelo não linear para refletir esse desvio que eu estava falando.

rosenjcb

Não há nada errado em transformar as variáveis usando log, raiz quadrada, recíprocos ou outros métodos. Você não está forçando nada. Você usa as transformações para encontrar o relacionamento linear entre as variáveis. Às vezes é fácil como você usa y = b0 + b1 * x. Outras vezes, as variáveis são linearmente relacionadas de maneira mais complicada, como por exemplo log (y) = b0 + b1 * (1 / x). A última função pode fornecer um bom relacionamento linear, mas é mais difícil de interpretar, portanto, quanto menos transformação você puder usar, melhor.

Koba

A função log-log é bastante simples log (y) = b0 + b1 * log (x). B1 é precisamente a variação percentual em y por variação percentual em x em sua análise de seção transversal. Novamente, se você tiver esses dados por um determinado período de tempo, basta fazer um gráfico para ver o relacionamento.

Koba

Já registrei variáveis antes e fiz outras transformações para meus modelos de regressão. Eu só estava preocupado que a elasticidade dava a pretensão de encontrar. Embora, pensando bem, o modelo fosse linear, apenas tinha o problema de ter variáveis dependentes e independentes com distribuições distorcidas.

Rosenjcb

12

A resposta para a pergunta é sim, é realmente significativa (pelo menos matematicamente falando). Se você estimar a equação linear

W = β_{0 0} + β_{1} P T R,

$W = \beta_0 + \beta_1 PTR,$

$\beta_1=\frac{\partial W }{\partial PTR}$ $\beta_1$ $PTR$ $W$

eu o g (W) = β_{0 0} + β_{1} eu o g (P T R),

$log(W) = \beta_0 + \beta_1 log(PTR),$

$\beta_1=\frac{\partial W}{\partial PTR}\cdot\frac{PTR}{W}$

De um modo geral, as transformações lineares afetam apenas a interpretação dada aos coeficientes, mas a validade da própria regressão (em termos econômicos gerais) é dada pelas premissas do modelo e pelos fenômenos econômicos analisados.

han-tyumi
fonte

8

$Y = \alpha X^\beta$ $\ln Y = \ln \alpha + \beta \ln X$

Acho que sua pergunta é se o uso dessa forma funcional faz ou não sentido em seu modelo específico. É difícil dizer. Como em qualquer regressão linear comum, você está assumindo a forma funcional. Você pode pelo menos pensar nisso como uma aproximação linear que faz mais sentido após a transformação do log-log.

jmbejara
fonte

7

$x$ $\alpha$ $\beta$ $F$

registro y_{Eu} = α + β registro x_{Eu} + \sum_{j = 2}^{S} γ_{j} χ_{j} + λ_{j} χ_{j} registro x_{Eu}

$\log y_i = \alpha + \beta \log x_i +\sum_{j=2}^S \gamma_j\chi_j +\lambda_j\chi_j\log x_i$

χ_{j}

$\chi_j$

γ

$\gamma$

λ

$\lambda$

Observe que, como uma representação da decisão subjacente "verdadeira", todas as transformações que resultam em uma regressão linear estão incorretas. De fato, todos os modelos vão estar errados. A questão é realmente: a estatística que você obteve deste modelo é útil para o seu problema ? Se o seu estudo estiver focado na determinação de um modelo subjacente, esse é um momento que lhe diz algo interessante sobre esse modelo mais profundo? Se você for mais orientado a políticas, uma aproximação com elasticidade constante o aproximará da verdade de que melhorias adicionais são irrelevantes? Ou são perguntas extremamente difíceis de responder como observador externo. Mas se a única alternativa com a qual você está preocupado é a elasticidade variável, o tipo de teste que descrevi acima pode lhe dar alguma tranqüilidade.

jayk
fonte

4

As outras respostas abordaram os principais problemas. Gostaria de responder à "Edição" feita pelo OP na pergunta:

Edit: Um dos meus maiores medos é que eu deveria ter usado um modelo não linear para mostrar o relacionamento. Eu sinto que forçar tanto a variável dependente quanto a independente a cooperar nessa regressão linear é enganoso de alguma forma.

Tendemos a esquecer que "transformar uma variável" leva a uma nova variável , cujo comportamento pode ser totalmente diferente do "original". O exemplo mais fácil é comparar os gráficos de uma variável e seu quadrado.

Portanto, considerando os logaritmos naturais de suas variáveis, você não examina mais a relação entre elas , mas uma relação entre alguma função delas.
É uma sorte que o conceito matemático de "logaritmo" possa ser vinculado ao conceito de "elasticidade", que descreve uma relação entre as mudanças percentuais, algo que entendemos do ponto de vista econômico e que podemos interpretar e usar significativamente.

Se se pode razoavelmente dizer que as variáveis exibem uma "relação linear nos logaritmos", significa que seus níveis (isto é, as variáveis reais) têm uma relação não linear:

em y \approx uma + b em x \Rightarrow y \approx e^{uma} + x^{b}

$\ln y \approx a+b\ln x \Rightarrow y \approx e^a + x^b$

Então, por que não estimar um modelo não linear?
Em princípio (matemático), não há razão para não. Algumas questões práticas são:

1) Existem muitas formas de relações não lineares, existe apenas uma relação linear (estruturalmente falando). É uma questão de "custos de pesquisa" para a especificação mais adequada.

2) A relação não linear obtida pode não ter uma explicação econômica clara . Por que isso é um problema? Porque não estamos descobrindo "leis da natureza" aqui, inalteradas no tempo e no espaço. Estamos nos aproximando de um fenômeno social. Ter uma aproximação que, além disso, só pode ser apresentada como uma fórmula matemática, sem um raciocínio econômico que a valide e apóie, torna o resultado muito reduzido.

3) A estimativa não linear é menos estável no que diz respeito à mecânica do algoritmo de estimativa.

Alecos Papadopoulos
fonte

3

Eu diria que o seu modelo nesse caso não parece significativo se o seu " objetivo era ver qual variável os salários dos professores mais afetados em qualquer município do meu estado ". Você acabou de mostrar qual é a correlação entre (os registros de) salários e declarações de imposto sobre a propriedade. Você deve pelo menos usar uma regressão múltipla.

Claro, você poderia continuar e desenvolver uma estratégia de identificação adequada e completa com as ferramentas metodológicas apropriadas para estimar a intensidade de cada efeito causal e encontrar o maior ... Na realidade, você provavelmente não será capaz fazê-lo, dadas as complexidades de tal tarefa. É apenas um continuum de refinamentos e você está perto do modelo mais grosseiro possível usado para explicar os salários, muito longe do que eu consideraria as aproximações aceitáveis de uma resposta à pergunta implícita em seu objetivo. Você deve tentar contar com a ajuda de um economista.

s_a
fonte

Econometria: a elasticidade é significativa em minha ou em alguma regressão?

Respostas: