Por que a hipótese de regressão logística é vista como uma função de probabilidade?
Entendo que o usamos para prever 0 ou 1, mas ainda assim, por que uma função (a hipótese) que gera números entre 0 e 1 pode ser considerada uma função de probabilidade?
Isso é heurístico?
regression
logistic
generalized-linear-model
user_anon
fonte
fonte
Respostas:
Não, não é apenas uma heurística.
A regressão logística é um caso particular de um modelo linear generalizado (GLM), neste caso para um processo em que a variável de resposta é condicionalmente Bernoulli (ou, mais geralmente, binomial ).
Um GLM inclui uma especificação de um modelo para a média condicional da resposta. No caso de uma variável de Bernoulli, sua média condicional é o parâmetro , que é explicitamente a probabilidade de a resposta ser . É modelado em termos de um ou mais preditores. Aqui está o modelo para a média de um único preditor, :pEu YEu 1 1 xEu
Portanto, é (intencionalmente) um modelo para a probabilidade de que a resposta seja , dado o valor dos preditores.1 1
A forma da função de link (e seu inverso ) também não é acidental - o link logit (que é o que faz com que a regressão logística) seja a função natural (ou canônica ) do link para uma resposta binomial. Outras opções de função de link são possíveis (e elas também serão modelos para a probabilidade de 1). Outras opções comuns para uma resposta binomial são o probit e o log-log complementar, mas a logística é de longe a mais comum.η= log( p / ( 1 - p ) ) p = exp( η) / ( 1 + exp( η) )
fonte