A regressão logística modela as chances de log de um evento como um conjunto de preditores. Ou seja, log (p / (1-p)) em que p é a probabilidade de algum resultado. Assim, a interpretação dos coeficientes de regressão logística bruta para alguma variável (x) deve estar na escala de chances de log. Ou seja, se o coeficiente de x = 5, sabemos que uma mudança de 1 unidade em x corresponde a uma mudança de 5 unidades na escala de chances logarítmicas de que um resultado ocorrerá.
No entanto, muitas vezes vejo pessoas interpretando coeficientes de regressão logística exponenciada como odds ratio. No entanto, claramente exp (log (p / (1-p))) = p / (1-p), que é uma probabilidade. Pelo que entendi, uma razão de chances é a probabilidade de um evento ocorrer (por exemplo, p / (1-p) para o evento A) sobre as chances de outro evento ocorrer (por exemplo, p / (1-p) para o evento B)
O que estou perdendo aqui? Parece que esta interpretação comum dos coeficientes de regressão logística exponenciada está incorreta.
fonte
Considere dois conjuntos de condições, a primeira descrita pelo vetor de variáveis independentes e a segunda descrita pelo vetor , que difere apenas na i-ésima variável e por uma unidade. Seja o vetor dos parâmetros do modelo, como de costume.X x i βX′ xi β
De acordo com o modelo de regressão logística, a probabilidade do evento ocorrer no primeiro caso é , de modo que as chances do evento ocorrerem são . p1p1=11+exp(−Xβ) p11−p1=exp(Xβ)
A probabilidade do evento ocorrer no segundo caso é , de modo que as chances do evento ocorrerem são . p2p2=11+exp(−X′β) p21−p2=exp(X′β)=exp(Xβ+βi)
A razão entre as probabilidades no segundo caso e as probabilidades no primeiro caso é, portanto, . Daí a interpretação do exponencial do parâmetro como um odds ratio.exp(βi)
fonte