Estou tentando converter minha coluna de fator em variáveis fictícias:
str(cards$pointsBin)
# Factor w/ 5 levels ".lte100",".lte150",..: 3 2 3 1 4 4 2 2 4 4 ...
labels <- model.matrix(~ pointsBin, data=cards)
head(labels)
# (Intercept) pointsBin.lte150 pointsBin.lte200 pointsBin.lte250 pointsBin.lte300
# 741 1 0 0 0 0
# 407 1 1 0 0 0
# 676 1 0 0 1 0
# 697 1 1 0 0 0
# 422 1 0 1 0 0
# 300 1 0 1 0 0
Não há coluna para o primeiro valor do meu fator ( ".lte100"
), que é o que a primeira linha deve ser categorizada como. Como obtenho esses dados de volta? E o que significa a coluna Interceptar, que parece ser todos os 1s?
r
categorical-data
categorical-encoding
digitgopher
fonte
fonte
- 1
quando tiver um único preditor categórico representado como um fator (como nesta pergunta), ele assumirá que você realmente não quer dizer isso e passa a usar o sum- codificação para zero; o que é obviamente apenas uma parametrização diferente. Muito amigável, se você me perguntar.Respostas:
Considere o seguinte:
Os dois primeiros comandos são idênticos. Os dois últimos comandos especificam não produzir a interceptação e mantém as duas variáveis fictícias produzidas.
fonte