Saya mencoba menjalankan xgboost di scikit belajar. Dan saya hanya menggunakan Panda untuk memuat data ke dalam dataframe. Bagaimana saya bisa menggunakan panda df dengan xgboost. Saya bingung dengan rutin DMatrix yang diperlukan untuk menjalankan xgboost algo.
scikit-learn
pandas
xgboost
Ghostintheshell
sumber
sumber
xgb.DMatrix(X_train.values, y_train.values)
saya melihatTypeError: can not initialize DMatrix from dict
.values
)Ada beberapa kabar baik ada perpustakaan
pandas_ml
yang mendukung XGBoost mungkin ini akan merampingkan alur kerja secara sederhana.http://pandas-ml.readthedocs.io/en/latest/xgboost.html
sumber
Anda sekarang dapat menggunakan Pandas DataFrames langsung dengan XGBoost. Pasti berfungsi dengan xgboost 0.81.
Misalnya di mana X_train, X_val, y_train, dan y_val adalah DataFrames:
sumber