Pertanyaan yang diberi tag python

Gunakan untuk pertanyaan ilmu data terkait dengan bahasa pemrograman Python. Tidak dimaksudkan untuk pertanyaan koding umum (-> stackoverflow).

101
Python vs R untuk pembelajaran mesin

Saya baru mulai mengembangkan aplikasi pembelajaran mesin untuk tujuan akademik. Saat ini saya menggunakan R dan melatih diri saya di dalamnya. Namun, di banyak tempat, saya telah melihat orang menggunakan Python . Apa yang digunakan orang di dunia akademis dan industri, dan apa

73
Perbedaan antara isna () dan isnull () dalam panda

Saya telah menggunakan panda untuk beberapa waktu. Tapi, saya tidak mengerti apa perbedaan antara isna()dan isnull()dalam panda. Dan, yang lebih penting, yang mana yang akan digunakan untuk mengidentifikasi nilai yang hilang dalam kerangka data. Apa perbedaan mendasar yang mendasari bagaimana...

33
Multi GPU dalam keras

Bagaimana Anda bisa memprogram di perpustakaan keras (atau tensorflow) untuk mempartisi pelatihan pada beberapa GPU? Katakanlah Anda menggunakan instance Amazon ec2 yang memiliki 8 GPU dan Anda ingin menggunakan semuanya untuk berlatih lebih cepat, tetapi kode Anda hanya untuk satu CPU atau...

33
Membuka file 20GB untuk analisis dengan panda

Saat ini saya mencoba untuk membuka file dengan panda dan python untuk tujuan pembelajaran mesin, akan ideal bagi saya untuk memiliki semuanya dalam DataFrame. Sekarang file tersebut berukuran 18GB dan RAM saya 32 GB tetapi saya terus mendapatkan kesalahan memori. Dari pengalaman Anda, mungkinkah?...

29
Mengapa xgboost jauh lebih cepat daripada sklearn GradientBoostingClassifier?

Saya mencoba untuk melatih model peningkatan gradien lebih dari 50k contoh dengan 100 fitur numerik. XGBClassifiermenangani 500 pohon dalam waktu 43 detik pada mesin saya, sementara GradientBoostingClassifierhanya menangani 10 pohon (!) dalam 1 menit dan 2 detik :( Saya tidak repot-repot mencoba...

27
Mengurangi parameter XGBoost

XGBoost telah melakukan pekerjaan dengan baik, ketika berurusan dengan variabel dependen kategoris dan kontinu. Tapi, bagaimana cara memilih parameter yang dioptimalkan untuk masalah XGBoost? Ini adalah bagaimana saya menerapkan parameter untuk masalah Kaggle baru-baru ini: param <- list(...

26
PyTorch vs. Tensorflow Fold

Baik PyTorch dan Tensorflow Fold adalah kerangka pembelajaran yang dalam yang dimaksudkan untuk menangani situasi di mana data input memiliki panjang atau dimensi yang tidak seragam (yaitu, situasi di mana grafik dinamis berguna atau dibutuhkan). Saya ingin tahu bagaimana mereka membandingkan,...