Gostaria de saber se faz diferença na interpretação se apenas as variáveis dependentes, dependentes e independentes ou apenas as independentes são transformadas em log.
Considere o caso de
log(DV) = Intercept + B1*IV + Error
Eu posso interpretar o IV como o aumento percentual, mas como isso muda quando eu tenho
log(DV) = Intercept + B1*log(IV) + Error
ou quando eu tiver
DV = Intercept + B1*log(IV) + Error
?
regression
data-transformation
interpretation
regression-coefficients
logarithm
r
dataset
stata
hypothesis-testing
contingency-tables
hypothesis-testing
statistical-significance
standard-deviation
unbiased-estimator
t-distribution
r
functional-data-analysis
maximum-likelihood
bootstrap
regression
change-point
regression
sas
hypothesis-testing
bayesian
randomness
predictive-models
nonparametric
terminology
parametric
correlation
effect-size
loess
mean
pdf
quantile-function
bioinformatics
regression
terminology
r-squared
pdf
maximum
multivariate-analysis
references
data-visualization
r
pca
r
mixed-model
lme4-nlme
distributions
probability
bayesian
prior
anova
chi-squared
binomial
generalized-linear-model
anova
repeated-measures
t-test
post-hoc
clustering
variance
probability
hypothesis-testing
references
binomial
profile-likelihood
self-study
excel
data-transformation
skewness
distributions
statistical-significance
econometrics
spatial
r
regression
anova
spss
linear-model
acima
fonte
fonte
Respostas:
Charlie fornece uma explicação correta e agradável. O site de computação estatística da UCLA tem mais alguns exemplos: http://www.ats.ucla.edu/stat/sas/faq/sas_interpret_log.htm e http://www.ats.ucla.edu/stat/mult_pkg/ faq / general / log_transformed_regression.htm
Apenas para complementar a resposta de Charlie, abaixo estão interpretações específicas de seus exemplos. Como sempre, interpretações de coeficientes assumem que você pode defender seu modelo, que os diagnósticos de regressão são satisfatórios e que os dados são de um estudo válido.
Exemplo A : Nenhuma transformação
"Um aumento de unidade em IV está associado a um
B1
aumento de ( ) unidade em DV".Exemplo B : Resultado transformado
"Um aumento de unidade IV está associado a um
B1 * 100
aumento de ( ) por cento no DV".Exemplo C : Exposição transformada
"Um aumento de 1% no IV está associado a um
B1 / 100
aumento de ( ) unidade no DV".Exemplo D : Resultado transformado e exposição transformada
"Um aumento de 1% no IV está associado a um
B1
aumento de ( )% no DV".fonte
Seguindo a mesma lógica, para o modelo de log de nível, temos
fonte
O principal objetivo da regressão linear é estimar uma diferença média de resultados comparando níveis adjacentes de um regressor. Existem muitos tipos de meios. Estamos mais familiarizados com a média aritmética.
A AM é o que é estimado usando OLS e variáveis não transformadas. A média geométrica é diferente:
Praticamente uma diferença GM é uma diferença multiplicativa: você paga X% de um prêmio em juros ao assumir um empréstimo, seus níveis de hemoglobina diminuem X% após o início da metformina, a taxa de falha das molas aumenta X% como uma fração da largura. Em todos esses casos, uma diferença média bruta faz menos sentido.
log(y) ~ x
y ~ log(x, base=2)
Por fim, o
log(y) ~ log(x)
simplesmente aplica as duas definições para obter uma diferença multiplicativa comparando grupos que diferem multiplicativamente nos níveis de exposição.fonte