Minhas previsões provenientes de um modelo de regressão logística (glm em R) não são delimitadas entre 0 e 1 como eu esperava. Meu entendimento da regressão logística é que seus parâmetros de entrada e modelo são combinados linearmente e a resposta é transformada em probabilidade usando a função de link de logit. Como a função logit é delimitada entre 0 e 1, eu esperava que minhas previsões fossem delimitadas entre 0 e 1.
No entanto, não é isso que vejo quando implemento a regressão logística em R:
data(iris)
iris.sub <- subset(iris, Species%in%c("versicolor","virginica"))
model <- glm(Species ~ Sepal.Length + Sepal.Width, data = iris.sub,
family = binomial(link = "logit"))
hist(predict(model))
Se alguma coisa a saída de prever (modelo) parece normal para mim. Alguém pode me explicar por que os valores que recebo não são probabilidades?
Respostas:
o
predict.glm
método por padrão retorna os preditores na escala do preditivo linear. Ou seja, eles ainda não passaram pela função de link.Experimentar
hist(predict(model, type = "response"))
em vez de
fonte