Apakah ada metode standar untuk menentukan titik operasi "optimal" pada kurva recall presisi ? (Yaitu, menentukan titik pada kurva yang menawarkan trade-off yang baik antara presisi dan recall) Terima
Apakah ada metode standar untuk menentukan titik operasi "optimal" pada kurva recall presisi ? (Yaitu, menentukan titik pada kurva yang menawarkan trade-off yang baik antara presisi dan recall) Terima
Katakanlah saya punya model klasifikasi prediksi berdasarkan hutan acak (menggunakan paket randomForest di R). Saya ingin mengaturnya agar pengguna akhir dapat menentukan item untuk menghasilkan prediksi, dan itu akan menampilkan kemungkinan klasifikasi. Sejauh ini, tidak masalah. Tetapi akan...
Apa manfaat dari memberikan nilai awal tertentu untuk probabilitas transisi dalam Model Markov Tersembunyi? Akhirnya sistem akan mempelajarinya, jadi apa gunanya memberikan nilai selain yang acak? Apakah algoritma yang mendasari membuat perbedaan seperti Baum-Welch? Jika saya mengetahui...
Saya bekerja dengan beberapa set data besar menggunakan paket gbm di R. Baik matriks prediktor saya dan vektor respons saya cukup jarang (yaitu sebagian besar entri adalah nol). Saya berharap untuk membangun pohon keputusan menggunakan algoritma yang mengambil keuntungan dari jarangnya ini, seperti...
Ini sudah ada dalam pikiran saya selama setidaknya beberapa jam. Saya mencoba menemukan k yang optimal untuk output dari algoritma k-means (dengan metrik kesamaan cosine ) jadi saya akhirnya merencanakan distorsi sebagai fungsi dari jumlah cluster. Dataset saya adalah kumpulan 800 dokumen dalam...
Makalah ini pada Adaboost memberikan beberapa saran dan kode (halaman 17) untuk memperluas model 2-kelas ke masalah kelas-K. Saya ingin menggeneralisasi kode ini, sehingga saya dapat dengan mudah memasang model 2-kelas yang berbeda dan membandingkan hasilnya. Karena sebagian besar model klasifikasi...
Saya menggunakan neuralnet di R untuk membangun NN dengan 14 input dan satu output. Saya membangun / melatih jaringan beberapa kali menggunakan data pelatihan input yang sama dan arsitektur / pengaturan jaringan yang sama. Setelah setiap jaringan diproduksi, saya menggunakannya pada data uji yang...
Pada pertengahan 1960-an, para peneliti dengan terkenal menyebut catur sebagai " Drosophila of AI": seperti halnya lalat buah, permainan catur dapat diakses dan masalah yang relatif mudah untuk diujicobakan, yang belum menghasilkan pengetahuan penting masalah yang lebih kompleks. Sekarang, orang...
Jika saya memiliki beberapa topologi non-berulang (DAG) tetap (set node dan tepi tetap, tetapi algoritma pembelajaran dapat memvariasikan berat pada tepi) dari sigmoid neuron dengan input neuron yang hanya dapat mengambil string di sebagai input dan mengarah ke satu output (yang menampilkan nilai...
Apa saja aplikasi atau keuntungan dari regresi reduksi dimensi (PRB) atau teknik reduksi dimensionalitas terawasi (SDR) dibandingkan teknik regresi tradisional (tanpa pengurangan dimensionalitas)? Kelas teknik ini menemukan representasi dimensi rendah dari set fitur untuk masalah regresi....
Saya ingin membandingkan 2 pengklasifikasi yang berbeda untuk masalah klasifikasi teks multi-kelas yang menggunakan dataset pelatihan besar. Saya ragu apakah saya harus menggunakan kurva ROC atau kurva belajar untuk membandingkan 2 pengklasifikasi. Di satu sisi, kurva pembelajaran berguna untuk...
Bisakah seseorang menjelaskan kepada saya konsep jarak Mahalanobis? Misalnya, berapa jarak Mahalanobis antara dua titik x dan y, dan terutama, bagaimana hal itu ditafsirkan untuk pengenalan
Contoh ukuran pemisahan kelas yang baik pada pembelajar diskriminan linier adalah rasio diskriminan linear Fisher. Apakah ada metrik berguna lainnya untuk menentukan apakah set fitur menyediakan pemisahan kelas yang baik antara variabel target? Secara khusus, saya tertarik untuk menemukan atribut...
Saya mungkin berurusan dengan masalah yang mungkin telah dipecahkan seratus kali sebelumnya, tetapi saya tidak yakin di mana menemukan jawabannya. Ketika menggunakan regresi logistik, diberikan banyak fitur dan mencoba memprediksi nilai kategorikal biner , saya tertarik untuk memilih subset dari...
Saya melatih proses Gaussian dengan kernel ARD dengan banyak parameter dengan memaksimalkan kemungkinan marginal dari data, dan bukannya cross-validasi. Saya menduga itu terlalu pas. Bagaimana saya bisa menguji kecurigaan ini dalam konteks
Saya membaca makalah ini tentang Generalized Wishart Processes (GWP). Makalah ini menghitung kovariansi antara variabel acak yang berbeda (mengikuti Proses Gaussian ) menggunakan fungsi kovarian eksponensial kuadrat, yaitu . Kemudian dikatakan bahwa matriks kovarians ini mengikuti...
Baru-baru ini saya diberitahu bahwa proses yang saya ikuti (komponen dari Tesis MS) dapat dilihat sebagai terlalu pas. Saya mencari untuk mendapatkan pemahaman yang lebih baik tentang ini dan melihat apakah orang lain setuju. Tujuan dari makalah ini adalah untuk Bandingkan kinerja Gradient...
Saya memiliki masalah klasifikasi biner dan saya mencoba berbagai pengklasifikasi di dalamnya: Saya ingin membandingkan pengklasifikasi. mana yang merupakan ukuran AUC atau akurasi yang lebih baik? Dan mengapa? Raondom Forest: AUC: 0.828 Accuracy: 79.6667 % SVM: AUC: 0.542 Accuracy: 85.6667...
Adakah yang bisa membantu memberikan penjelasan konseptual tentang bagaimana prediksi dibuat untuk data baru saat menggunakan smooths / splines untuk model prediksi? Misalnya, mengingat model yang dibuat menggunakan gamboostdalam mboostpaket di R, dengan p-splines, bagaimana prediksi untuk data...
Tidak yakin apakah ini sesuai untuk situs ini, tapi saya mulai MSE saya dalam ilmu komputer (BS dalam matematika terapan) dan ingin mendapatkan latar belakang yang kuat dalam pembelajaran mesin (saya kemungkinan besar akan mengejar gelar PhD). Salah satu sub-minat saya adalah jaringan saraf. Apa...