Apa perbedaan antara Support Vector Machines dan Linear Discriminant
Apa perbedaan antara Support Vector Machines dan Linear Discriminant
Saya bekerja dengan banyak algoritma: RandomForest, DecisionTrees, NaiveBayes, SVM (kernel = linear dan rbf), KNN, LDA dan XGBoost. Semuanya cukup cepat kecuali untuk SVM. Saat itulah saya mengetahui bahwa perlu penskalaan fitur untuk bekerja lebih cepat. Kemudian saya mulai bertanya-tanya apakah...
Saya telah belajar tentang model bahaya proporsional Cox. Saya memiliki banyak pengalaman pas model regresi logistik, dan model sehingga untuk membangun intuisi saya telah membandingkan cocok menggunakan coxphdari R "survival" dengan model regresi logistik cocok menggunakan glmdengan...
Bisakah Anda memberikan contoh penduga MLE dari mean yang bias? Saya tidak mencari contoh yang merusak penduga MLE secara umum dengan melanggar kondisi keteraturan. Semua contoh yang dapat saya lihat di internet merujuk pada varians, dan sepertinya saya tidak dapat menemukan apa pun yang terkait...
Anda dan saya memutuskan untuk memainkan permainan di mana kami bergiliran membalik koin. Pemain pertama yang membalikkan 10 kepala total memenangkan permainan. Tentu saja, ada argumen tentang siapa yang harus pergi dulu. Simulasi permainan ini menunjukkan bahwa pemain yang membalik pertama menang...
Saya ingin menghasilkan sampel dari wilayah biru yang didefinisikan di sini: Solusi naif adalah menggunakan sampel penolakan di unit square, tetapi ini hanya memberikan efisiensi (~ 21,4%).1−π/41−π/41-\pi/4 Apakah ada cara agar saya dapat mencicipi lebih efisien?
Saya memiliki data tentang perilaku pergerakan (waktu yang dihabiskan untuk tidur, kurang gerak, dan melakukan aktivitas fisik) yang jumlahnya kira-kira 24 (seperti dalam jam per hari). Saya ingin membuat variabel yang menangkap waktu relatif yang dihabiskan dalam masing-masing perilaku ini - Saya...
Definisi standar pencilan untuk plot Kotak dan Kumis adalah poin di luar rentang , di mana dan adalah kuartil pertama dan adalah kuartil ketiga dari data.{Q1−1.5IQR,Q3+1.5IQR}{Q1−1.5IQR,Q3+1.5IQR}\left\{Q1-1.5IQR,Q3+1.5IQR\right\}IQR=Q3−Q1IQR=Q3−Q1IQR= Q3-Q1Q1Q1Q1Q3Q3Q3 Apa dasar dari definisi...
Saya tidak mengerti apa sebenarnya perbedaan antara prediksi "in-sample" dan "out of sample"? Prakiraan dalam sampel menggunakan subset dari data yang tersedia untuk memperkirakan nilai di luar periode estimasi. Alih-alih perkiraan sampel menggunakan semua data yang tersedia Apakah ini benar...
Mari kita asumsikan bahwa kita memiliki sampel dua variabel acak Bernoulli independen, dan .B e r ( θ 2 )Ber(θ1)Ber(θ1)\mathrm{Ber}(\theta_1)Ber(θ2)Ber(θ2)\mathrm{Ber}(\theta_2) Bagaimana kami membuktikan bahwa
Regresi beta (yaitu GLM dengan distribusi beta dan biasanya fungsi tautan log) sering direkomendasikan untuk menangani respons alias variabel dependen yang mengambil nilai antara 0 dan 1, seperti fraksi, rasio, atau probabilitas: Regresi untuk hasil (rasio atau fraksi) antara 0 dan 1 . Namun,...
Saya ditanya pertanyaan ini tempo hari dan tidak pernah mempertimbangkannya sebelumnya. Intuisi saya berasal dari kelebihan masing-masing estimator. Kemungkinan maksimum lebih disukai ketika kami yakin dalam proses menghasilkan data karena, tidak seperti metode momen, itu memanfaatkan pengetahuan...
Saya baru saja selesai membaca diskusi ini . Mereka berpendapat bahwa PR AUC lebih baik daripada ROC AUC pada dataset yang tidak seimbang. Sebagai contoh, kami memiliki 10 sampel dalam dataset uji. 9 sampel positif dan 1 negatif. Kami memiliki model mengerikan yang memprediksi semuanya positif....
Saya memiliki 150 fitur, dan banyak di antaranya sangat berkorelasi satu sama lain. Tujuan saya adalah untuk memprediksi nilai variabel diskrit, yang kisarannya 1-8 . Ukuran sampel saya adalah 550 , dan saya menggunakan validasi silang 10 kali lipat . AFAIK, di antara metode regularisasi (Lasso,...
Jika hasil uji t satu sisi saya signifikan tetapi ukuran sampel kecil (mis. Di bawah 20 atau lebih), dapatkah saya tetap mempercayai hasil ini? Jika tidak, bagaimana saya harus menangani dan / atau menafsirkan hasil
Ini juga diketahui bahwa regresi linier dengan penalti setara dengan menemukan perkiraan MAP diberi Gaussian sebelumnya pada koefisien. Demikian pula, menggunakan l 1 penalti setara dengan menggunakan distribusi Laplace sebagai sebelumnya.l2l2l^2l1l1l^1 Tidak jarang menggunakan kombinasi...
Saya menggunakan Lasso untuk pemilihan fitur dalam pengaturan dimensi yang relatif rendah (n >> p). Setelah memasang model Lasso, saya ingin menggunakan kovariat dengan koefisien bukan nol agar sesuai dengan model tanpa penalti. Saya melakukan ini karena saya ingin perkiraan yang tidak bias...
Saya tahu tentang manfaat regularisasi ketika membangun model prediksi (bias vs varians, mencegah overfitting). Tapi, saya bertanya-tanya apakah itu ide yang baik untuk juga melakukan regularisasi (laso, ridge, elastis net) ketika tujuan utama dari model regresi adalah inferensi pada koefisien...
Diberikan adalah 6 batas keputusan di bawah ini. Batas keputusan adalah garis violett. Dots dan crosses adalah dua set data yang berbeda. Kita harus memutuskan yang mana adalah: SVM linear Kernelized SVM (kernel polinomial pesanan 2) Perceptron Regresi logistik Neural Network (1 lapisan...
PCA yang kuat (seperti yang dikembangkan oleh Candes et al 2009 atau lebih baik dari Netrepalli et al 2014 ) adalah metode yang populer untuk deteksi outlier multivarian , tetapi jarak Mahalanobis juga dapat digunakan untuk deteksi outlier dengan memberikan estimasi yang kuat dan teratur dari...