Eu executei essa regressão logística ordinal em R:
mtcars_ordinal <- polr(as.factor(carb) ~ mpg, mtcars)
Eu recebi este resumo do modelo:
summary(mtcars_ordinal)
Re-fitting to get Hessian
Call:
polr(formula = as.factor(carb) ~ mpg, data = mtcars)
Coefficients:
Value Std. Error t value
mpg -0.2335 0.06855 -3.406
Intercepts:
Value Std. Error t value
1|2 -6.4706 1.6443 -3.9352
2|3 -4.4158 1.3634 -3.2388
3|4 -3.8508 1.3087 -2.9425
4|6 -1.2829 1.3254 -0.9679
6|8 -0.5544 1.5018 -0.3692
Residual Deviance: 81.36633
AIC: 93.36633
Eu posso obter as probabilidades de log do coeficiente mpg
assim:
exp(coef(mtcars_ordinal))
mpg
0.7917679
E as probabilidades de log dos limites, como:
exp(mtcars_ordinal$zeta)
1|2 2|3 3|4 4|6 6|8
0.001548286 0.012084834 0.021262900 0.277242397 0.574406353
Alguém poderia me dizer se minha interpretação deste modelo está correta:
À medida que
mpg
aumenta em uma unidade, as chances de passar da categoria 1carb
para qualquer uma das outras 5 categorias diminui em -0,23. Se as probabilidades do log ultrapassarem o limite de 0,0015, o valor previsto para um carro será da categoria 2 decarb
. Se as probabilidades do log ultrapassarem o limite de 0,0121, o valor previsto para um carro será da categoria 3carb
e assim por diante.
fonte
mpg
polr
define o modelo comologit P(Y <= k | x) = zeta_k - eta
, a interpretação do @ StasK não deve ser lida: "À medida quempg
aumenta em uma unidade, as chances de observar a categoria 1 decarb
vs. outras 5 categorias aumentam 26% (exp(-(-0.2335)) = 1.26
)".No modelo de logit ordenado, as probabilidades formam a razão entre a probabilidade estar em qualquer categoria abaixo de um limite específico e a probabilidade estar em uma categoria acima do mesmo limite (por exemplo, com três categorias: probabilidade de estar na categoria A ou B vs C, bem como a probabilidade de pertencer à categoria A vs. B ou C).
Isso leva ao modelo,
logit P(Y <= k | x) = zeta_k - eta
conforme especificado na descrição depolr()
. Portanto, as taxas de chances podem ser construídas para diferentes categorias ou para diferentes regressores. O último, o mais comum, compara odds para as mesmas categorias, mas diferentes regressores e iguaisO odds ratio para diferentes categorias é definido como
em que a razão é independente dos regressores. Essa propriedade leva ao modelo de chances proporcionais do nome alternativo .
Neste exemplo simples, mas talvez não muito intuitivo, você pode formular: Para um aumento de uma unidade no regressor
mpg
, as chances de observar a categoria 1 vs. a observação de qualquer categoria mais alta (ou as chances de observar qualquer categoria abaixo de um certo limite vs. observando qualquer categoria acima do mesmo limite) são multiplicadas por 1,26 ou aumentadas em 26% (exp(-(-0.233 - 0)) = 1.263
). Se você deseja formular uma razão de chances de diferentes categorias, pode dizer, por exemplo, que as probabilidades de pertencer à categoria 1 vs. qualquer categoria acima são comparadas às chances de pertencer à categoria 1 ou 2 e de qualquer categoria acimaexp((-6.470) - (-4.415)) = 0.128
. Em que a última interpretação não é muito útil nesta configuração específica. Um exemplo de uma razão de chances para diferentes categorias pode ser a chance de ingressar na faculdade em comparação com as chances de ingressar no ensino médio.fonte