Pertanyaan yang diberi tag reinforcement-learning

Area pembelajaran mesin yang berkaitan dengan bagaimana agen perangkat lunak harus mengambil tindakan di lingkungan untuk memaksimalkan beberapa gagasan tentang imbalan kumulatif.

29
Mengapa xgboost jauh lebih cepat daripada sklearn GradientBoostingClassifier?

Saya mencoba untuk melatih model peningkatan gradien lebih dari 50k contoh dengan 100 fitur numerik. XGBClassifiermenangani 500 pohon dalam waktu 43 detik pada mesin saya, sementara GradientBoostingClassifierhanya menangani 10 pohon (!) dalam 1 menit dan 2 detik :( Saya tidak repot-repot mencoba...

11
Apakah ada model bahasa out-of-the-box yang bagus untuk python?

Saya membuat prototipe aplikasi dan saya membutuhkan model bahasa untuk menghitung kebingungan pada beberapa kalimat yang dihasilkan. Apakah ada model bahasa terlatih dalam python yang bisa saya gunakan? Sesuatu yang sederhana seperti model = LanguageModel('en') p1 = model.perplexity('This is a...

10
Pembelajaran Kooperatif Penguatan

Saya sudah memiliki implementasi berfungsi untuk agen tunggal yang mengerjakan masalah penetapan harga dinamis dengan tujuan memaksimalkan pendapatan. Masalah yang sedang saya tangani, bagaimanapun, melibatkan beberapa produk berbeda yang merupakan pengganti satu sama lain, sehingga penetapan harga...