Qual é a melhor maneira de preparar interações de recursos categóricos antes de se adaptar ao scikit-learn?
Com statsmodels
eu poderia dizer convenientemente em estilo R smf.ols(formula = 'depvar ~ C(var1)*C(var2)', data=df).fit()
(o mesmo em Stata com regress depvar i.var1##i.var2
).
Pode sklearn.preprocessing.PolynomialFeatures
(na v0.15, atualmente dev) ser usado com variáveis categóricas?
machine-learning
interaction
python
scikit-learn
manobrar
fonte
fonte
~var1*var2
É perfeitamente bem em R para a construção da matriz de RHS)dmatrix
) #Use Patsy .
Patsy é uma das minhas bibliotecas favoritas do Python: faz uma coisa, e apenas uma coisa, muito bem.
fonte