Pertanyaan yang diberi tag machine-learning

11

Bagaimana memilih titik operasi yang baik dari kurva recall presisi?

Apakah ada metode standar untuk menentukan titik operasi "optimal" pada kurva recall presisi ? (Yaitu, menentukan titik pada kurva yang menawarkan trade-off yang baik antara presisi dan recall) Terima

machine-learning precision-recall

11

Apakah ada cara untuk menjelaskan prediksi dari model hutan acak?

Katakanlah saya punya model klasifikasi prediksi berdasarkan hutan acak (menggunakan paket randomForest di R). Saya ingin mengaturnya agar pengguna akhir dapat menentukan item untuk menghasilkan prediksi, dan itu akan menampilkan kemungkinan klasifikasi. Sejauh ini, tidak masalah. Tetapi akan...

machine-learning random-forest

11

Signifikansi probabilitas transisi awal dalam model markov tersembunyi

Apa manfaat dari memberikan nilai awal tertentu untuk probabilitas transisi dalam Model Markov Tersembunyi? Akhirnya sistem akan mempelajarinya, jadi apa gunanya memberikan nilai selain yang acak? Apakah algoritma yang mendasari membuat perbedaan seperti Baum-Welch? Jika saya mengetahui...

machine-learning expectation-maximization hidden-markov-model

11

Apakah ada perpustakaan yang tersedia untuk metode seperti CART menggunakan prediktor & respons jarang?

Saya bekerja dengan beberapa set data besar menggunakan paket gbm di R. Baik matriks prediktor saya dan vektor respons saya cukup jarang (yaitu sebagian besar entri adalah nol). Saya berharap untuk membangun pohon keputusan menggunakan algoritma yang mengambil keuntungan dari jarangnya ini, seperti...

r regression machine-learning classification cart

11

Apakah ada kasus di mana tidak ada k optimal dalam k-means?

Ini sudah ada dalam pikiran saya selama setidaknya beberapa jam. Saya mencoba menemukan k yang optimal untuk output dari algoritma k-means (dengan metrik kesamaan cosine ) jadi saya akhirnya merencanakan distorsi sebagai fungsi dari jumlah cluster. Dataset saya adalah kumpulan 800 dokumen dalam...

machine-learning clustering k-means

11

Memperluas model 2 kelas ke masalah multi-kelas

Makalah ini pada Adaboost memberikan beberapa saran dan kode (halaman 17) untuk memperluas model 2-kelas ke masalah kelas-K. Saya ingin menggeneralisasi kode ini, sehingga saya dapat dengan mudah memasang model 2-kelas yang berbeda dan membandingkan hasilnya. Karena sebagian besar model klasifikasi...

r machine-learning classification statistical-learning multi-class

11

Bagaimana cara meningkatkan stabilitas jaringan saraf saya?

Saya menggunakan neuralnet di R untuk membangun NN dengan 14 input dan satu output. Saya membangun / melatih jaringan beberapa kali menggunakan data pelatihan input yang sama dan arsitektur / pengaturan jaringan yang sama. Setelah setiap jaringan diproduksi, saya menggunakannya pada data uji yang...

r machine-learning neural-networks

11

Apa Drosophila AI sekarang?

Pada pertengahan 1960-an, para peneliti dengan terkenal menyebut catur sebagai " Drosophila of AI": seperti halnya lalat buah, permainan catur dapat diakses dan masalah yang relatif mudah untuk diujicobakan, yang belum menghasilkan pengetahuan penting masalah yang lebih kompleks. Sekarang, orang...

machine-learning

11

Menghitung dimensi VC dari jaringan saraf

Jika saya memiliki beberapa topologi non-berulang (DAG) tetap (set node dan tepi tetap, tetapi algoritma pembelajaran dapat memvariasikan berat pada tepi) dari sigmoid neuron dengan input neuron yang hanya dapat mengambil string di sebagai input dan mengarah ke satu output (yang menampilkan nilai...

machine-learning neural-networks algorithms vc-dimension

11

Apa keuntungan dari mengurangi dimensi prediksi untuk keperluan regresi?

Apa saja aplikasi atau keuntungan dari regresi reduksi dimensi (PRB) atau teknik reduksi dimensionalitas terawasi (SDR) dibandingkan teknik regresi tradisional (tanpa pengurangan dimensionalitas)? Kelas teknik ini menemukan representasi dimensi rendah dari set fitur untuk masalah regresi....

regression machine-learning pca dimensionality-reduction

11

Evaluasi pengklasifikasi: kurva belajar vs kurva ROC

Saya ingin membandingkan 2 pengklasifikasi yang berbeda untuk masalah klasifikasi teks multi-kelas yang menggunakan dataset pelatihan besar. Saya ragu apakah saya harus menggunakan kurva ROC atau kurva belajar untuk membandingkan 2 pengklasifikasi. Di satu sisi, kurva pembelajaran berguna untuk...

machine-learning classification roc accuracy

11

Berapa jarak Mahalanobis, & bagaimana ia digunakan dalam pengenalan pola?

Bisakah seseorang menjelaskan kepada saya konsep jarak Mahalanobis? Misalnya, berapa jarak Mahalanobis antara dua titik x dan y, dan terutama, bagaimana hal itu ditafsirkan untuk pengenalan

machine-learning mathematical-statistics distance-functions

11

Ukuran pemisahan kelas dalam masalah klasifikasi

Contoh ukuran pemisahan kelas yang baik pada pembelajar diskriminan linier adalah rasio diskriminan linear Fisher. Apakah ada metrik berguna lainnya untuk menentukan apakah set fitur menyediakan pemisahan kelas yang baik antara variabel target? Secara khusus, saya tertarik untuk menemukan atribut...

machine-learning classification feature-selection discriminant-analysis

11

Pentingnya variabel dalam regresi logistik

Saya mungkin berurusan dengan masalah yang mungkin telah dipecahkan seratus kali sebelumnya, tetapi saya tidak yakin di mana menemukan jawabannya. Ketika menggunakan regresi logistik, diberikan banyak fitur dan mencoba memprediksi nilai kategorikal biner , saya tertarik untuk memilih subset dari...

machine-learning logistic classification

11

Bagaimana Anda bisa mendeteksi jika proses Gaussian terlalu pas?

Saya melatih proses Gaussian dengan kernel ARD dengan banyak parameter dengan memaksimalkan kemungkinan marginal dari data, dan bukannya cross-validasi. Saya menduga itu terlalu pas. Bagaimana saya bisa menguji kecurigaan ini dalam konteks

machine-learning cross-validation gaussian-process

11

Matriks kovarian untuk proses Gaussian dan distribusi Wishart

Saya membaca makalah ini tentang Generalized Wishart Processes (GWP). Makalah ini menghitung kovariansi antara variabel acak yang berbeda (mengikuti Proses Gaussian ) menggunakan fungsi kovarian eksponensial kuadrat, yaitu . Kemudian dikatakan bahwa matriks kovarians ini mengikuti...

machine-learning normal-distribution covariance wishart nonparametric-bayes

11

Apakah ada overfitting dalam pendekatan modellng ini

Baru-baru ini saya diberitahu bahwa proses yang saya ikuti (komponen dari Tesis MS) dapat dilihat sebagai terlalu pas. Saya mencari untuk mendapatkan pemahaman yang lebih baik tentang ini dan melihat apakah orang lain setuju. Tujuan dari makalah ini adalah untuk Bandingkan kinerja Gradient...

machine-learning data-mining predictive-models

11

Bandingkan pengklasifikasi berdasarkan AUROC atau akurasi?

Saya memiliki masalah klasifikasi biner dan saya mencoba berbagai pengklasifikasi di dalamnya: Saya ingin membandingkan pengklasifikasi. mana yang merupakan ukuran AUC atau akurasi yang lebih baik? Dan mengapa? Raondom Forest: AUC: 0.828 Accuracy: 79.6667 % SVM: AUC: 0.542 Accuracy: 85.6667...

machine-learning classification auc

11

Cara memprediksi data baru dengan regresi spline / smooth

Adakah yang bisa membantu memberikan penjelasan konseptual tentang bagaimana prediksi dibuat untuk data baru saat menggunakan smooths / splines untuk model prediksi? Misalnya, mengingat model yang dibuat menggunakan gamboostdalam mboostpaket di R, dengan p-splines, bagaimana prediksi untuk data...

regression machine-learning predictive-models splines

11

Latar belakang matematika untuk jaringan saraf

Tidak yakin apakah ini sesuai untuk situs ini, tapi saya mulai MSE saya dalam ilmu komputer (BS dalam matematika terapan) dan ingin mendapatkan latar belakang yang kuat dalam pembelajaran mesin (saya kemungkinan besar akan mengejar gelar PhD). Salah satu sub-minat saya adalah jaringan saraf. Apa...

machine-learning neural-networks mathematical-statistics references