Pertanyaan yang diberi tag classification

43
Asumsi hutan acak

Saya agak baru ke hutan acak jadi saya masih berjuang dengan beberapa konsep dasar. Dalam regresi linier, kami mengasumsikan pengamatan independen, varians konstan ... Apa asumsi / hipotesis dasar yang kita buat, ketika kita menggunakan hutan acak? Apa perbedaan utama antara hutan acak dan...

42
Mengapa downsample?

Misalkan saya ingin mempelajari classifier yang memprediksi jika email adalah spam. Dan anggaplah hanya 1% dari email adalah spam. Hal termudah untuk dilakukan adalah mempelajari pengklasifikasi sepele yang mengatakan tidak ada email yang merupakan spam. Penggolong ini akan memberi kita akurasi...

37
SVM, Overfitting, kutukan dimensi

Dataset saya kecil (120 sampel), namun jumlah fitur besar bervariasi dari (1000-200.000). Meskipun saya sedang melakukan pemilihan fitur untuk memilih subset fitur, itu mungkin masih sesuai. Pertanyaan pertama saya adalah, bagaimana SVM menangani overfitting, jika sama sekali. Kedua, ketika saya...

35
PCA dan split kereta / tes

Saya memiliki dataset yang memiliki beberapa set label biner. Untuk setiap set label, saya melatih classifier, mengevaluasinya dengan validasi silang. Saya ingin mengurangi dimensi menggunakan analisis komponen utama (PCA). Pertanyaanku adalah: Apakah mungkin untuk melakukan PCA satu kali untuk...

34
Mengapa ada perbedaan antara menghitung interval kepercayaan 95% regresi logistik secara manual, dan menggunakan fungsi confint () di R?

Dear everyone - Saya telah memperhatikan sesuatu yang aneh yang tidak dapat saya jelaskan, bukan? Singkatnya: pendekatan manual untuk menghitung interval kepercayaan dalam model regresi logistik, dan fungsi R confint()memberikan hasil yang berbeda. Saya telah melalui regresi logistik Terapan...