A situação
Eu tenho um conjunto de dados com um dependente uma variável independente . Quero ajustar uma regressão linear por partes contínua com pontos de interrupção conhecidos / fixos que ocorrem em . Os breakpoins são conhecidos sem incerteza, então não quero calculá-los. Então eu ajuste uma regressão (OLS) no formato Aqui está um exemplo emx k ( a 1 , a 2 , … , a k ) y i = β 0 + β 1 x i + β 2 max ( x i - a 1 , 0 ) + β 3 max ( x i - a 2 , 0 ) + … + Β k + 1 máx ( x
R
set.seed(123)
x <- c(1:10, 13:22)
y <- numeric(20)
y[1:10] <- 20:11 + rnorm(10, 0, 1.5)
y[11:20] <- seq(11, 15, len=10) + rnorm(10, 0, 2)
Vamos supor que o ponto de interrupção ocorra em : 9,6
mod <- lm(y~x+I(pmax(x-9.6, 0)))
summary(mod)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 21.7057 1.1726 18.511 1.06e-12 ***
x -1.1003 0.1788 -6.155 1.06e-05 ***
I(pmax(x - 9.6, 0)) 1.3760 0.2688 5.120 8.54e-05 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
A interceptação e a inclinação dos dois segmentos são: e para o primeiro e e para o segundo, respectivamente.- 1,1 8,5 0,27
Questões
- Como calcular facilmente a interceptação e a inclinação de cada segmento? O modelo pode ser rememetrizado para fazer isso em um cálculo?
- Como calcular o erro padrão de cada inclinação de cada segmento?
- Como testar se duas inclinações adjacentes têm as mesmas inclinações (isto é, se o ponto de interrupção pode ser omitido)?
fonte
x
eI(pmax(x-9.6,0))
, isso está correto?Minha abordagem ingênua, que responde à pergunta 1:
Mas não tenho certeza se as estatísticas (em particular os graus de liberdade) são feitas corretamente, se você fizer dessa maneira.
fonte