Regressão logística e variáveis ​​independentes ordinais

10

Eu encontrei este post:

Sim. O coeficiente reflete a alteração nas chances de log para cada incremento de alteração no preditor ordinal. Essa especificação de modelo (muito comum) pressupõe que o preditor tenha um impacto linear em seus incrementos. Para testar a suposição, você pode comparar um modelo no qual você usa a variável ordinal como um único preditor com aquele em que discretiza as respostas e as trata como múltiplos preditores (como faria se a variável fosse nominal); se o último modelo não resultar em um ajuste significativamente melhor, é razoável tratar cada incremento como tendo um efeito linear.

- @ dmk38 12 dez '10 em 05:21

Você poderia me dizer onde pode encontrar algo publicado que apóie essa reivindicação? Estou trabalhando com dados e gostaria de usar variáveis ​​independentes ordinais na regressão logística.

Frederico
fonte
Veja uma pergunta semelhante stats.stackexchange.com/q/195246/3277
ttnphns

Respostas:

2

Como observa o @Scortchi , você também pode usar polinômios ortogonais. Aqui está uma demonstração rápida em R:

set.seed(3406)
N      = 50
real.x = runif(N, 0, 10)
ord.x  = cut(real.x, breaks=c(0,2,4,6,8,10), labels=FALSE)
ord.x  = factor(ord.x, levels=1:5, ordered=TRUE)
lo.lin = -3 + .5*real.x
p.lin  = exp(lo.lin)/(1 + exp(lo.lin))
y.lin  = rbinom(N, 1, prob=p.lin)

mod.lin = glm(y.lin~ord.x, family=binomial)
summary(mod.lin)
# ...
# Coefficients:
#             Estimate Std. Error z value Pr(>|z|)   
# (Intercept)  0.05754    0.36635   0.157  0.87520   
# ord.x.L      2.94083    0.90304   3.257  0.00113 **
# ord.x.Q      0.94049    0.85724   1.097  0.27260   
# ord.x.C     -0.67049    0.77171  -0.869  0.38494   
# ord.x^4     -0.09155    0.73376  -0.125  0.90071   
# ...
- Reinstate Monica
fonte
8

Qualquer bom livro sobre regressão logística terá isso, embora talvez não exatamente nessas palavras. Experimente a Análise de dados categóricos da Agresti para obter uma fonte muito autorizada.

Também decorre da definição de regressão logística (ou outras regressões). Existem poucos métodos explicitamente para variáveis ​​independentes ordinais . As opções usuais são tratá-lo como categórico (que perde a ordem) ou como contínuo (o que faz a suposição declarada no que você citou). Se você o tratar como contínuo, o programa que está fazendo a análise não sabe que é ordinal. Por exemplo, suponha que sua IV seja "Quanto você gosta do Presidente Obama?" e suas opções de resposta são uma escala Likert de 1. "Muito" a 5. "De maneira nenhuma". Se você tratar isso como contínuo, então (do ponto de vista do programa) uma resposta "5" é 5 vezes uma resposta "1". Isso pode ou não ser irracional.

Peter Flom - Restabelece Monica
fonte
3
Seção 5.4.6. E você pode estender a ideia usando polinômios ortogonais para codificar o preditor ordinal.
Scortchi - Restabelecer Monica
Obrigado por seus comentários, eles ajudarão muito na minha análise.
Frederico
2
@ Frederico, se a resposta de Peter resolveu sua pergunta, você deve aceitá-la clicando na marca de seleção abaixo do total de votos à esquerda.
gung - Restabelece Monica