Por que a hipótese de regressão logística é vista como uma função de probabilidade?

7

Por que a hipótese de regressão logística é vista como uma função de probabilidade?

Entendo que o usamos para prever 0 ou 1, mas ainda assim, por que uma função (a hipótese) que gera números entre 0 e 1 pode ser considerada uma função de probabilidade?

Isso é heurístico?

user_anon
fonte
este post pode ser útil. Verifique a resposta aceita. stats.stackexchange.com/questions/229645/…
Haitao Du

Respostas:

9

Não, não é apenas uma heurística.

A regressão logística é um caso particular de um modelo linear generalizado (GLM), neste caso para um processo em que a variável de resposta é condicionalmente Bernoulli (ou, mais geralmente, binomial ).

Um GLM inclui uma especificação de um modelo para a média condicional da resposta. No caso de uma variável de Bernoulli, sua média condicional é o parâmetro , que é explicitamente a probabilidade de a resposta ser . É modelado em termos de um ou mais preditores. Aqui está o modelo para a média de um único preditor, :pEuYEu1 1xEu

P(YEu=1 1|xEu)=exp(β0 0+β1 1xEu)1 1+exp(β0 0+β1 1xEu)

Portanto, é (intencionalmente) um modelo para a probabilidade de que a resposta seja , dado o valor dos preditores.1 1

A forma da função de link (e seu inverso ) também não é acidental - o link logit (que é o que faz com que a regressão logística) seja a função natural (ou canônica ) do link para uma resposta binomial. Outras opções de função de link são possíveis (e elas também serão modelos para a probabilidade de 1). Outras opções comuns para uma resposta binomial são o probit e o log-log complementar, mas a logística é de longe a mais comum.η=registro(p/(1 1-p))p=exp(η)/(1 1+exp(η))

Glen_b -Reinstate Monica
fonte
Corrija-me se estiver errado, mas a função deve ser uma regra de pontuação adequada. Nesses casos, refletirá a probabilidade.
Cagdas Ozgenc # 6/16
@Cagdas O critério que está sendo otimizado nos GLMs de estimativa é a probabilidade (embora o MLE possa ser visto como um caso especial de estimativa ótima de pontuação). Você está lançando a modelagem de variáveis ​​de Bernoulli como um problema de previsão aqui?
Glen_b -Reinstala Monica