Alguém pode ajudar a dar uma explicação conceitual de como as previsões são feitas para novos dados ao usar suavizações / splines para um modelo preditivo? Por exemplo, dado um modelo criado usando gamboost
o mboost
pacote em R, com p-splines, como são feitas as previsões para novos dados? O que é usado nos dados de treinamento?
Diga que existe um novo valor da variável independente x e queremos prever y. Uma fórmula para criação de splines é aplicada a esse novo valor de dados usando os nós ou df usados no treinamento do modelo e, em seguida, os coeficientes do modelo treinado são aplicados para gerar a previsão?
Aqui está um exemplo com R, o que é previsto fazer conceitualmente para gerar 899.4139 para os novos dados mean_radius = 15,99?
#take the data wpbc as example
library(mboost)
data(wpbc)
modNew<-gamboost(mean_area~mean_radius, data = wpbc, baselearner = "bbs", dfbase = 4, family=Gaussian(),control = boost_control(mstop = 5))
test<-data.frame(mean_radius=15.99)
predict(modNew,test)
Respostas:
A maneira como a previsão é calculada é assim:
mean_radius
mboost
mboost
bbs(rnorm(100))$dpp(rep(1,100))$predict
,e vá explorar a partir daí. Por exemplo,
with(environment(bbs(rnorm(100))$dpp(rep(1,100))$predict), newX)
chamadas
with(environment(bbs(rnorm(100))$dpp(rep(1,100))$predict), Xfun)
fonte