Pertanyaan yang diberi tag classification

228

Apa AUC berdiri dan apa itu?

Dicari tinggi dan rendah dan belum dapat menemukan apa AUC, seperti yang terkait dengan prediksi, singkatan atau

136

Pilihan K dalam validasi silang K-fold

Saya telah menggunakan KKK ganda lintas validasi beberapa kali sekarang untuk mengevaluasi kinerja beberapa algoritma belajar, tapi aku selalu bingung bagaimana aku harus memilih nilai .KKK Saya sering melihat dan menggunakan nilai K= 10K=10K = 10 , tetapi ini tampaknya benar-benar sewenang-wenang...

machine-learning classification cross-validation

131

Kappa Cohen dalam bahasa Inggris sederhana

Saya membaca buku data mining dan disebutkan statistik Kappa sebagai sarana untuk mengevaluasi kinerja prediksi pengklasifikasi. Namun, saya tidak bisa mengerti ini. Saya juga memeriksa Wikipedia tetapi tidak membantu juga: https://en.wikipedia.org/wiki/Cohen's_kappa . Bagaimana kappa Cohen...

classification data-mining cohens-kappa

107

Mengapa akurasi bukan ukuran terbaik untuk menilai model klasifikasi?

Ini adalah pertanyaan umum yang ditanyakan secara tidak langsung beberapa kali di sini, tetapi tidak memiliki jawaban otoritatif tunggal. Alangkah baiknya memiliki jawaban terperinci untuk ini sebagai referensi. Akurasi , proporsi klasifikasi yang benar di antara semua klasifikasi, adalah ukuran...

machine-learning classification accuracy model-evaluation scoring-rules

92

Bagaimana Anda menghitung presisi dan penarikan kembali untuk klasifikasi multi-kelas menggunakan matriks kebingungan?

Saya bertanya-tanya bagaimana cara menghitung presisi dan mengingat menggunakan matriks kebingungan untuk masalah klasifikasi multi-kelas. Secara khusus, pengamatan hanya dapat ditugaskan untuk kelas / label yang paling mungkin. Saya ingin menghitung: Presisi = TP / (TP + FP) Ingat kembali = TP...

machine-learning classification precision-recall multi-class

78

Cara menghitung Area Di Bawah Kurva (AUC), atau statistik-c, dengan tangan

Saya tertarik menghitung area di bawah kurva (AUC), atau c-statistik, dengan tangan untuk model regresi logistik biner. Misalnya, dalam dataset validasi, saya memiliki nilai sebenarnya untuk variabel dependen, retensi (1 = dipertahankan; 0 = tidak dipertahankan), serta status retensi yang...

regression logistic classification roc auc

77

Bagaimana cara menghasilkan plot yang bagus dari hasil analisis klaster k-means?

Saya menggunakan R untuk melakukan pengelompokan K-means. Saya menggunakan 14 variabel untuk menjalankan K-means Apa cara yang bagus untuk memplot hasil K-means? Apakah ada implementasi yang ada? Apakah memiliki 14 variabel menyulitkan merencanakan hasilnya? Saya menemukan sesuatu yang...

data-visualization classification k-means unsupervised-learning

76

Bantu saya memahami Mesin Dukungan Vektor

Saya memahami dasar-dasar apa tujuan Support Vector Machines dalam hal mengklasifikasikan set input ke beberapa kelas yang berbeda, tetapi apa yang saya tidak mengerti adalah beberapa detail seluk beluk. Sebagai permulaan, saya agak bingung dengan penggunaan Slack Variables. Apa tujuan mereka Saya...

machine-learning classification svm

76

Pemilihan fitur untuk model "final" saat melakukan validasi silang dalam pembelajaran mesin

Saya agak bingung tentang pemilihan fitur dan pembelajaran mesin dan saya bertanya-tanya apakah Anda dapat membantu saya. Saya memiliki dataset microarray yang diklasifikasikan ke dalam dua kelompok dan memiliki ribuan fitur. Tujuan saya adalah mendapatkan sejumlah kecil gen (fitur saya) (10-20)...

machine-learning classification cross-validation feature-selection genetics

75

Mengapa Regresi Logistik tidak disebut Klasifikasi Logistik?

Karena Regresi Logistik adalah model klasifikasi statistik yang berhubungan dengan variabel dependen kategorikal, mengapa tidak disebut Klasifikasi Logistik ? Bukankah seharusnya nama "Regresi" dicadangkan untuk model yang berhubungan dengan variabel dependen

regression machine-learning logistic classification terminology

75

Cara terbaik untuk menyajikan hutan acak dalam publikasi?

Saya menggunakan algoritma hutan acak sebagai penggolong kuat dari dua kelompok dalam studi microarray dengan ribuan fitur. Apa cara terbaik untuk menyajikan hutan acak sehingga ada cukup informasi untuk membuatnya dapat diproduksi ulang di kertas? Apakah ada metode plot dalam R untuk...

r machine-learning classification random-forest microarray

73

Mengapa jaringan saraf menjadi lebih dalam, tetapi tidak lebih luas?

Dalam beberapa tahun terakhir, jaringan saraf convolutional (atau mungkin jaringan saraf yang dalam secara umum) telah menjadi lebih dalam dan lebih dalam, dengan jaringan canggih mulai dari 7 lapisan ( AlexNet ) hingga 1000 lapisan ( Residual Nets) di ruang 4 tahun. Alasan di balik peningkatan...

machine-learning classification neural-networks deep-learning conv-neural-network

72

Bagaimana cara menghitung presisi / recall untuk klasifikasi multiclass-multilabel?

Saya bertanya-tanya bagaimana cara menghitung pengukuran presisi dan penarikan untuk klasifikasi multilabel multilabel, yaitu klasifikasi di mana terdapat lebih dari dua label, dan di mana setiap instance dapat memiliki beberapa

machine-learning classification precision-recall multi-class

66

Bagaimana cara memplot kurva ROC dalam klasifikasi multi-kelas?

Dengan kata lain, alih-alih memiliki masalah dua kelas saya berurusan dengan 4 kelas dan masih ingin menilai kinerja menggunakan

classification roc

63

Fungsi Softmax vs Sigmoid di Logistic classifier?

Apa yang menentukan pilihan fungsi (Softmax vs Sigmoid) dalam pengklasifikasi Logistik? Misalkan ada 4 kelas output. Masing-masing fungsi di atas memberikan probabilitas masing-masing kelas menjadi hasil yang benar. Jadi mana yang harus diambil untuk

machine-learning logistic classification softmax

60

Bagaimana saya bisa membantu memastikan data pengujian tidak bocor ke dalam data pelatihan?

Misalkan kita memiliki seseorang yang membangun model prediktif, tetapi seseorang belum tentu berpengalaman dalam prinsip-prinsip statistik atau pembelajaran mesin yang tepat. Mungkin kita membantu orang itu saat mereka sedang belajar, atau mungkin orang itu menggunakan semacam paket perangkat...

machine-learning classification predictive-models cross-validation out-of-sample

55

Alternatif untuk regresi logistik di R

Saya ingin banyak algoritma yang melakukan tugas yang sama dengan regresi logistik. Itu adalah algoritma / model yang dapat memberikan prediksi untuk respon biner (Y) dengan beberapa variabel penjelas (X). Saya akan senang jika setelah Anda menyebutkan algoritma, jika Anda juga akan menunjukkan...

r regression logistic classification predictive-models

53

Kapan data tidak seimbang benar-benar masalah dalam Pembelajaran Mesin?

Kami sudah memiliki beberapa pertanyaan tentang data yang tidak seimbang ketika menggunakan regresi logistik , SVM , pohon keputusan , mengantongi dan sejumlah pertanyaan serupa lainnya, yang menjadikannya topik yang sangat populer! Sayangnya, masing-masing pertanyaan tampaknya khusus untuk...

machine-learning classification predictive-models unbalanced-classes

52

Klasifikasi biner dengan kelas yang sangat tidak seimbang

Saya memiliki kumpulan data dalam bentuk (fitur, keluaran biner 0 atau 1), tetapi 1 jarang terjadi, jadi hanya dengan selalu memprediksi 0, saya mendapatkan akurasi antara 70% dan 90% (tergantung pada data tertentu yang saya lihat ). Metode ML memberi saya akurasi yang sama, dan saya merasa, harus...

machine-learning classification binary-data unbalanced-classes

52

Apa perbedaan antara Multiclass dan Multilabel Problem

Apa perbedaan antara masalah multikelas dan masalah

classification clustering terminology multi-class multilabel