Regressão logística para dados de distribuições de Poisson

11

De algumas notas de aprendizado de máquina, falando sobre alguns métodos de classificação discriminativa, em particular a regressão logística, onde y é o rótulo da classe (0 ou 1) e x são os dados, diz-se que:

se x|y=0Poisson(λ0) , e x|y=1Poisson(λ1) , em seguida, p(y|x) será logística.

Por que isso é verdade?

sambajetson
fonte

Respostas:

16

Y tem dois valores possíveis para qualquer valor dado deX . De acordo com as premissas,

Pr(X=x|Y=0)=exp(λ0)λ0xx!

e

Pr(X=x|Y=1)=exp(λ1)λ1xx!.

Portanto (este é um caso trivial do Teorema de Bayes), a chance de condicional em é a probabilidade relativa deste último, a saberY=1X=x

Pr(Y=1|X=x)=exp(λ1)λ1xx!exp(λ1)λ1xx!+exp(λ0)λ0xx!=11+exp(β0+β1x)

Onde

β0=λ1λ0

e

β1=log(λ1/λ0).

Esse é realmente o modelo de regressão logística padrão.

whuber
fonte