Pertanyaan yang diberi tag nltk

29
Mengapa xgboost jauh lebih cepat daripada sklearn GradientBoostingClassifier?

Saya mencoba untuk melatih model peningkatan gradien lebih dari 50k contoh dengan 100 fitur numerik. XGBClassifiermenangani 500 pohon dalam waktu 43 detik pada mesin saya, sementara GradientBoostingClassifierhanya menangani 10 pohon (!) dalam 1 menit dan 2 detik :( Saya tidak repot-repot mencoba...

15
Kesamaan antara dua kata

Saya mencari perpustakaan Python yang membantu saya mengidentifikasi kesamaan antara dua kata atau kalimat. Saya akan melakukan konversi Audio ke Teks yang akan menghasilkan kamus bahasa Inggris atau kata-kata non-kamus (Ini bisa berupa Orang atau nama Perusahaan) Setelah itu, saya perlu...

8
Kompleks Chunking dengan NLTK

Saya mencoba mencari cara untuk menggunakan chunker cascading NLTK sesuai Bab 7 buku NLTK . Sayangnya, saya mengalami beberapa masalah saat melakukan tindakan chunking yang tidak sepele. Mari kita mulai dengan frasa ini: "adventure movies between 2000 and 2015 featuring performances by daniel...