Acabei de perceber que sempre trabalhei com problemas de regressão em que as variáveis independentes sempre eram numéricas. Posso usar regressão linear no caso em que todas as variáveis independentes são categóricas?
fonte
Acabei de perceber que sempre trabalhei com problemas de regressão em que as variáveis independentes sempre eram numéricas. Posso usar regressão linear no caso em que todas as variáveis independentes são categóricas?
Apenas algumas semânticas e para ser claro:
Portanto, na maioria das situações, o tipo de regressão depende do tipo de variável dependente, resultado ou " " . Por exemplo, a regressão linear é usada quando a variável dependente é contínua, a regressão logística quando o dependente é categórico com 2 categorias e a regressão multinomi (n) al quando o dependente é categórico com mais de 2 categorias. Os preditores podem ser qualquer coisa (nominal ou ordinal categórica, ou contínua ou uma mistura) .
(A observação abaixo pode ser redundante para você, mas eu a adiciono de qualquer maneira)
No entanto, observe que a maioria dos softwares exige que você recodifique preditores categóricos em um sistema numérico binário . Isso significa apenas codificar sexo para 0 para mulheres e 1 para homens ou vice-versa. Para variáveis categóricas com mais de 2 níveis, você precisará recodificá-las em variáveis dummy , onde é o número de níveis e esses manequins contêm um 0 ou 1 quando estão na categoria correspondente. Dessa forma, cada indivíduo (amostra) deve ser representado com 1 para a variável dummy da qual faz parte e 0 para os outros, ou 0 para todos os manequins quando faz parte do grupo de referência.