Regressão apenas com variáveis ​​categóricas

24

É possível realizar uma regressão se todas as variáveis ​​dependentes e independentes forem variáveis ​​categóricas?

altruísta
fonte
3
Certamente é possível, mesmo para regressão comum ou de jardim, desde que a variável de resposta (dependente) seja tratada puramente numericamente. Dependendo do seu software, pode ser necessário pressionar ou forçar isso a acontecer. Com uma definição adequadamente ampla de regressão, para incluir regressão logística ou ordinal, não é apenas possível, é comum.
27613 Nick Cox

Respostas:

31

Precisamos ser claros em nossos termos aqui, mas, em geral, sim :

  • Se sua variável dependente é contínua (e os resíduos são normalmente distribuídos - veja aqui ), mas todas as suas variáveis ​​independentes são categóricas, isso é apenas uma ANOVA .
  • Se sua variável dependente é categórica e suas variáveis ​​independentes são contínuas, isso seria regressão logística (possivelmente binária, ordinal ou multinomial , dependendo).
  • Se a sua variável dependente e a sua independente são variáveis ​​categóricas, você ainda pode usar a regressão logística - é o tipo da versão ANOVA-ish do LR.

Observe que a regressão logística e a regressão de mínimos quadrados ordinários (lineares) são casos especiais do Modelo Linear Generalizado .

- Reinstate Monica
fonte
É o terceiro caso que você mencionou, tentei LR, nenhum dos coeficientes considerados significativos. Eu pensei que poderia estar fazendo algo errado.
Altruist
2
Não acho que a ANOVA exija uma variável dependente contínua mais do que requer resíduos normalmente distribuídos. Estas são apenas condições sob as quais se espera que a ANOVA funcione bem.
27613 Nick Cox
11
@NickCox, você está certo, é claro; estamos discutindo sobre como definimos e aplicamos esses termos. A maneira que eu colocaria é que o modelo é derivado dessas suposições, mas a ANOVA pode ser usada mesmo que não seja cumprida, com a questão de saber se os resultados serão úteis dependendo.
gung - Restabelece Monica
11
@ altruísta, expus os três casos por uma questão de clareza conceitual; Eu reconheço que o último é o que você quer. Observe que se você está usando o software corretamente para ajustar-se ao modelo e se seus coeficientes são "significativos" não tem relação com o fato de LR ser ou não o modelo apropriado para sua situação.
gung - Restabelece Monica
4
Observe que ser categórico às vezes é uma questão de definição para o software e às vezes na mente de quem vê. Qual é o número de filhos, por exemplo?
27613 Nick Cox