Qual é o significado intuitivo de ter uma relação linear entre os logs de duas variáveis?

20

Eu tenho duas variáveis que não mostram muita correlação quando plotadas uma contra a outra, mas uma relação linear muito clara quando plotamos os logs de cada variável novamente.

Então, eu terminaria com um modelo do tipo:

\log (Y) = a \log (X) + b

$\log(Y) = a \log(X) + b$ , que é ótimo matematicamente, mas não parece ter o valor explicativo de um modelo linear regular.

Como posso interpretar esse modelo?

regression correlation log Filhos de Akaike
fonte

5

Não tenho nada substancial a acrescentar às respostas existentes, mas um logaritmo no resultado e no preditor é uma elasticidade. As pesquisas por esse termo devem encontrar bons recursos para interpretar esse relacionamento, o que não é muito intuitivo.

Upper_Case-Stop Harming Monica

A interpretação de um modelo de log-log, em que a variável dependente é log (y) e a variável independente é log (x), é:

% Δ = β_{1} % Δ x

$\%Δ=β_1\%Δx$ .

Bob

3

O link log-log complementar é uma especificação GLM ideal quando o resultado é binário (modelo de risco) e a exposição é cumulativa, como número de parceiros sexuais versus infecção pelo HIV. jstor.org/stable/2532454

AdamO 27/03

2

@ Alexis, você pode ver os pontos pegajosos se sobrepor as curvas. Tente curve(exp(-exp(x)), from=-5, to=5)vs curve(plogis(x), from=-5, to=5). A concavidade acelera. Se o risco de evento de um único encontro foi

p

$p$ , o risco após o segundo evento deve ser

1 - (1 - p)^{2}

$1-(1-p)^2$ e assim por diante, essa é uma forma probabilística que o logit não captura. Exposições muito altas distorceriam os resultados da regressão logística de maneira mais dramática (falsamente, de acordo com a regra de probabilidade anterior). Alguma simulação mostraria isso a você.

AdamO 27/03

1

@AdamO Provavelmente, há um trabalho pedagógico a ser escrito incorporando uma simulação que motiva como escolher um link de resultado dicotômico em particular dos três, incluindo situações em que ele faz e não faz diferença.

Alexis

27

Você só precisa tomar exponencial dos dois lados da equação e obterá uma relação potencial, que pode fazer sentido para alguns dados.

\log (Y) = a \log (X) + b

$\log(Y) = a\log(X) + b$

\exp (\log (Y)) = \exp (a \log (X) + b)

$\exp(\log(Y)) = \exp(a \log(X) + b)$

Y = e^{b} \cdot X^{a}

$Y = e^b\cdot X^a$

E como é apenas um parâmetro que pode assumir qualquer valor positivo, esse modelo é equivalente a: $e^b$

Y = c \cdot X^{a}

$Y=c \cdot X^a$

Deve-se notar que a expressão do modelo deve incluir o termo de erro, e essa alteração de variáveis tem efeitos interessantes sobre ele:

\log (Y) = a \log (X) + b + ϵ

$\log(Y) = a \log(X) + b + \epsilon$

Y = e^{b} \cdot X^{a} \cdot \exp (ϵ)

$Y = e^b\cdot X^a\cdot \exp(\epsilon)$

Ou seja, seu modelo com erros aditivos respeitando as condições para OLS (erros normalmente distribuídos com variação constante) é equivalente a um modelo potencial com erros multiplicativos cujo logaritm segue uma distribuição normal com variação constante.

Pere
fonte

3

O OP pode estar interessado em saber que esta distribuição tem um nome, o log-normal: en.wikipedia.org/wiki/Log-normal_distribution

gardenhead

2

E o efeito da desigualdade de Jensen? Geralmente para g convexo,

E [g (X)] \geq g (E [X])

$E[g(X)]≥g(E[X])$

estatísticas

14

Você pode pegar seu modelo calcular o diferencial total; você terminará com algo como: que gera $\log(Y)=a\log(X)+b$

\frac{1}{Y} d Y = a \frac{1}{X} d X

$\frac{1}YdY=a\frac{1}XdX$

\frac{d Y}{d X} \frac{X}{Y} = a

$\frac{dY}{dX}\frac{X}{Y}=a$

Por isso, uma interpretação simples do coeficiente será a percentagem de alteração em para uma alteração percentual em . Isto implica além disso que as variáveis crescimentos em uma constante fracção ( ) da taxa de crescimento de . $a$ $Y$ $X$ $Y$ $a$ $X$

RScrlli
fonte

Portanto, se o gráfico log-log for linear, isso implicaria uma taxa de crescimento constante?

Dimitriy V. Masterov 26/03

Na verdade, a taxa de crescimento de será constante se e somente se .

Y

$Y$

a = 0

$a=0$

RScrlli 26/03

Com o tempo, a taxa de crescimento em relação ao crescimento em x.

Dimitriy V. Masterov 26/03

reordenar não ajuda, eu removia-o

Aksakal 26/03

1

@ DimitriyV.Masterov Ok, em seguida, uma vez que o é linear em , isso significa que a variável cresce a uma fracção constante da taxa de crescimento de . Há algo errado com a minha resposta, de acordo com você?

\log (Y)

$\log(Y)$

\log (X)

$\log(X)$

Y

$Y$

X

$X$

RScrlli 26/03

7

Intuitivamente nos fornece a ordem de magnitude de uma variável, para que possamos ver o relacionamento como as ordens de magnitudes das duas variáveis são linearmente relacionadas. Por exemplo, aumentar o preditor em uma ordem de magnitude pode estar associado a um aumento de três ordens de magnitude da resposta. $\log$

Ao plotar usando um gráfico de log-log , esperamos ver um relacionamento linear. Usando um exemplo desta pergunta , podemos verificar as suposições do modelo linear:

log-log

qwr
fonte

3

+1 para uma resposta intuitiva a um conceito não intuitivo. No entanto, a imagem que você incluiu viola claramente a variação constante de erros no preditor.

Frans Rodenburg

1

A resposta está certa, mas a atribuição de autoria está errada. A imagem não deve ser atribuída às Imagens do Google, mas, pelo menos, à página da Web em que ela pode ser encontrada, que pode ser encontrada apenas clicando nas imagens do Google.

Pere

@Pere Infelizmente não consigo encontrar a fonte original da imagem (pelo menos usando a pesquisa reversa de imagens)

qwr

Parece que ele veio originalmente de diagramss.us, embora o site esteja fora do ar e a maioria de suas páginas não esteja no arquivo da Web, além da página inicial.

Henry

4

Para reconciliar a resposta do @Rscrill com dados discretos reais, considere

\log (Y_{t}) = a \log (X_{t}) + b, \log (Y_{t - 1}) = a \log (X_{t - 1}) + b

$\log(Y_t) = a\log(X_t) + b,\;\;\; \log(Y_{t-1}) = a\log(X_{t-1}) + b$

⟹ \log (Y_{t}) - \log (Y_{t - 1}) = a [\log (X_{t}) - \log (X_{t - 1})]

$\implies \log(Y_t) - \log(Y_{t-1}) = a\left[\log(X_t)-\log(X_{t-1})\right]$

Mas

\log (Y_{t}) - \log (Y_{t - 1}) = \log (\frac{Y_{t}}{Y_{t - 1}}) \equiv \log (\frac{Y_{t - 1} + Δ Y_{t}}{Y_{t - 1}}) = \log (1 + \frac{Δ Y_{t}}{Y_{t - 1}})

$\log(Y_t) - \log(Y_{t-1}) = \log\left(\frac{Y_t}{Y_{t-1}}\right) \equiv \log\left(\frac{Y_{t-1}+\Delta Y_t}{Y_{t-1}}\right) = \log\left(1+\frac{\Delta Y_t}{Y_{t-1}}\right)$

$\frac{\Delta Y_t}{Y_{t-1}}$ é a variação percentual de entre os períodos e , ou a taxa de crescimento de , digamos . Quando é menor que , temos que uma aproximação aceitável é $Y$ $t-1$ $t$ $Y_t$ $g_{Y_{t}}$ $0.1$

\log (1 + \frac{Δ Y_{t}}{Y_{t - 1}}) \approx \frac{Δ Y_{t}}{Y_{t - 1}} = g_{Y_{t}}

$\log\left(1+\frac{\Delta Y_t}{Y_{t-1}}\right) \approx \frac{\Delta Y_t}{Y_{t-1}}=g_{Y_{t}}$

Portanto, temos

g_{Y_{t}} \approx a g_{X_{t}}

$g_{Y_{t}}\approx ag_{X_{t}}$

que valida em estudos empíricos o tratamento teórico do @Rscrill.

Alecos Papadopoulos
fonte

1

Provavelmente é isso que um matemático chamaria de intuitivo :)

Richard Hardy

2

Um relacionamento linear entre os logs é equivalente a uma dependência da lei de potência : Na física, esse comportamento significa que o sistema está livre de escala ou invariável . Por exemplo, se é distância ou tempo, isso significa que a dependência de não pode ser caracterizada por um comprimento ou uma escala de tempo característicos (em oposição a decaimentos exponenciais). Como resultado, um tal sistema apresenta uma dependência de longa duração do em .

Y \sim X^{α}

$Y \sim X^\alpha$

X

$X$

X

$X$

Y

$Y$

X

$X$

Itamar
fonte

Qual é o significado intuitivo de ter uma relação linear entre os logs de duas variáveis?

Respostas: