Por que os coeficientes de regressão logística exponenciada são considerados “odds ratio”?

10

A regressão logística modela as chances de log de um evento como um conjunto de preditores. Ou seja, log (p / (1-p)) em que p é a probabilidade de algum resultado. Assim, a interpretação dos coeficientes de regressão logística bruta para alguma variável (x) deve estar na escala de chances de log. Ou seja, se o coeficiente de x = 5, sabemos que uma mudança de 1 unidade em x corresponde a uma mudança de 5 unidades na escala de chances logarítmicas de que um resultado ocorrerá.

No entanto, muitas vezes vejo pessoas interpretando coeficientes de regressão logística exponenciada como odds ratio. No entanto, claramente exp (log (p / (1-p))) = p / (1-p), que é uma probabilidade. Pelo que entendi, uma razão de chances é a probabilidade de um evento ocorrer (por exemplo, p / (1-p) para o evento A) sobre as chances de outro evento ocorrer (por exemplo, p / (1-p) para o evento B)

O que estou perdendo aqui? Parece que esta interpretação comum dos coeficientes de regressão logística exponenciada está incorreta.

jack
fonte

Respostas:

10

A resposta do @ Laconic é ótima e completa, na minha opinião. Algo que eu queria acrescentar é que os coeficientes originais descrevem uma diferença nas probabilidades de log para duas unidades que diferem em 1 no preditor. Por exemplo, para um coeficiente em de 5, podemos dizer que a diferença nas probabilidades de log entre duas unidades que diferem em por 1 é 5. Matematicamente,XXX

β=log(odds(p|X=x0+1))log(odds(p|X=x0))

Ao exponenciar , você obtémβ

exp(β)=exp(log(odds(p|X=x0+1))log(odds(p|X=x0)))=exp(log(odds(p|X=x0+1)))exp(log(odds((p|X=x0)))=odds(p|X=x0+1)odds(p|X=x0))

que é uma razão de chances, uma razão de chances.

Noé
fonte
2
Isso é extremamente claro para mim. Minha pergunta está resolvida.
jack
10

Considere dois conjuntos de condições, a primeira descrita pelo vetor de variáveis ​​independentes e a segunda descrita pelo vetor , que difere apenas na i-ésima variável e por uma unidade. Seja o vetor dos parâmetros do modelo, como de costume.Xx i βXxiβ

De acordo com o modelo de regressão logística, a probabilidade do evento ocorrer no primeiro caso é , de modo que as chances do evento ocorrerem são . p1p1=11+exp(Xβ)p11p1=exp(Xβ)

A probabilidade do evento ocorrer no segundo caso é , de modo que as chances do evento ocorrerem são . p2p2=11+exp(Xβ)p21p2=exp(Xβ)=exp(Xβ+βi)

A razão entre as probabilidades no segundo caso e as probabilidades no primeiro caso é, portanto, . Daí a interpretação do exponencial do parâmetro como um odds ratio.exp(βi)

The Laconic
fonte