Ilmu Data

25
Koefisien Gini vs Gini pengotor - pohon keputusan

Masalahnya mengacu pada pembuatan pohon keputusan. Menurut Wikipedia ' koefisien Gini ' tidak boleh disamakan dengan ' pengotor Gini '. Namun kedua ukuran tersebut dapat digunakan saat membangun pohon keputusan - ini dapat mendukung pilihan kita saat membagi set item. 1) 'Pengotor Gini' - ini...

25
LightGBM vs XGBoost

Saya mencoba memahami mana yang lebih baik (lebih akurat, terutama dalam masalah klasifikasi) Saya telah mencari artikel yang membandingkan LightGBM dan XGBoost tetapi hanya menemukan dua: https://medium.com/implodinggradients/benchmarking-lightgbm-how-fast-is-lightgbm-vs-xgboost-15d224568031 -...

24
Gambar VM untuk proyek ilmu data

Karena ada banyak alat yang tersedia untuk tugas-tugas ilmu data, dan rumit untuk menginstal semuanya dan membangun sistem yang sempurna. Apakah ada gambar Linux / Mac OS dengan Python, R dan alat sains data open-source lainnya diinstal dan tersedia untuk digunakan orang sekarang juga? Ubuntu atau...

24
Apakah pakaian acak Forest?

Saya telah membaca tentang Hutan Acak tetapi saya tidak dapat menemukan jawaban pasti tentang masalah overfitting. Menurut kertas asli Breiman, mereka tidak boleh berpakaian berlebihan ketika menambah jumlah pohon di hutan, tetapi tampaknya tidak ada konsensus mengenai hal ini. Ini membuat saya...

24
Ada konsol R Online?

Saya mencari konsol online untuk bahasa R. Seperti saya menulis kode dan server harus mengeksekusi dan memberi saya output. Mirip dengan situs web

24
Arti fitur laten?

Saya belajar tentang faktorisasi matriks untuk sistem yang merekomendasikan dan saya melihat istilah yang latent featuresterjadi terlalu sering tetapi saya tidak dapat memahami apa artinya. Saya tahu apa fitur itu tetapi saya tidak mengerti ide fitur laten. Bisakah tolong jelaskan? Atau setidaknya...