Estou tentando executar o xgboost no scikit learn. E eu só uso o Pandas para carregar dados no dataframe. Como eu devo usar pandas df com xgboost. Estou confuso com a rotina do DMatrix necessária para executar o xgboost algo.
scikit-learn
pandas
xgboost
Fantasma na Concha
fonte
fonte
xgb.DMatrix(X_train.values, y_train.values)
eu estou vendoTypeError: can not initialize DMatrix from dict
.values
)Há boas notícias. Existe uma biblioteca
pandas_ml
que suporta XGBoost, provavelmente isso simplificará o fluxo de trabalho de maneira simples.http://pandas-ml.readthedocs.io/en/latest/xgboost.html
fonte
Agora você pode usar os DataFrames do Pandas diretamente com o XGBoost. Definitivamente funciona com o xgboost 0.81.
Por exemplo, onde X_train, X_val, y_train e y_val são DataFrames:
fonte