Adakah yang bisa menyarankan tahap apa yang tepat untuk menghapus variabel berkorelasi sebelum rekayasa fitur atau setelah rekayasa
Adakah yang bisa menyarankan tahap apa yang tepat untuk menghapus variabel berkorelasi sebelum rekayasa fitur atau setelah rekayasa
Saya ingin menjalankan beberapa model pembelajaran mesin seperti hutan acak, peningkatan gradien, atau SVM pada dataset saya. Ada lebih dari 200 variabel prediktor dalam dataset saya dan kelas target saya adalah variabel biner. Apakah saya perlu menjalankan pemilihan fitur sebelum pemasangan...
Ketika mencoba melakukan mis klasifikasi, pendekatan saya saat ini adalah coba berbagai algoritma terlebih dahulu dan patok mereka melakukan pemilihan fitur pada algoritma terbaik dari 1 di atas tune parameter menggunakan fitur dan algoritma yang dipilih Namun, saya sering tidak dapat...
Saya sering membangun model (klasifikasi atau regresi) di mana saya memiliki beberapa variabel prediktor yang berurutan dan saya telah berusaha untuk menemukan rekomendasi teknik untuk merangkumnya dengan cara terbaik untuk dimasukkan sebagai prediktor dalam model. Sebagai contoh konkret,...
Saya mencari situs web atau buku di mana beberapa contoh praktis diberikan langkah demi langkah, menjelaskan bagaimana mereka memilih fitur yang relevan, prosedur pemilihan model, dll
Plot berikut menunjukkan koefisien yang diperoleh dengan regresi linier (dengan mpgsebagai variabel target dan yang lainnya sebagai prediktor). Untuk dataset mtcars (di sini dan di sini ) baik dengan dan tanpa menskala data: Bagaimana cara menafsirkan hasil ini? Variabel hpdan dispsignifikan...
Salah satu metodologi untuk memilih subset dari fitur Anda yang tersedia untuk classifier Anda adalah memberi peringkat berdasarkan kriteria (seperti perolehan informasi) dan kemudian menghitung akurasi menggunakan classifier Anda dan subset dari fitur peringkat. Misalnya, jika fitur Anda adalah...
Saya memiliki dua tensor a:[batch_size, dim] b:[batch_size, dim]. Saya ingin melakukan produk dalam untuk setiap pasangan dalam batch, menghasilkan c:[batch_size, 1], di mana c[i,0]=a[i,:].T*b[i,:].
Ada beberapa pendekatan pemilihan fitur / pemilihan variabel (lihat misalnya Guyon & Elisseeff, 2003 ; Liu et al., 2010 ): metode filter (misalnya, berbasis korelasi, berbasis entropi, berbasis kepentingan hutan acak), metode pembungkus (misalnya, pencarian maju, pencarian mendaki bukit), dan...
Katakanlah kita memperkirakan penjualan toko dan data pelatihan saya memiliki dua set fitur: Satu tentang penjualan toko dengan tanggal (bidang "Toko" tidak unik) Satu tentang jenis toko (bidang "Toko" unik di sini) Jadi matriksnya akan terlihat seperti
Saya sudah membaca penjelasan konvolusi dan memahaminya sampai batas tertentu. Adakah yang bisa membantu saya memahami bagaimana operasi ini berhubungan dengan konvolusi dalam Jaring Saraf Konvolusional? Apakah fungsi seperti filter gyang menerapkan
Saya memiliki kumpulan data yang berisi, di antara banyak fitur, koordinat GPS (lintang dan bujur). Saya ingin menggunakan set data ini untuk mengeksplorasi masalah seperti: (1) menghitung ETA untuk mendorong antara titik awal dan akhir; dan (2) memperkirakan jumlah kejahatan untuk suatu titik...
Ditutup . Pertanyaan ini perlu lebih fokus . Saat ini tidak menerima jawaban. Ingin meningkatkan pertanyaan ini? Perbarui pertanyaan sehingga berfokus pada satu masalah hanya dengan mengedit posting ini . Ditutup 5 tahun yang lalu . Sepertinya sebagian...
Saya memiliki sejumlah besar sampel yang mewakili bit stream yang disandikan Manchester sebagai sinyal audio. Frekuensi di mana mereka dikodekan adalah komponen frekuensi utama ketika tinggi, dan ada jumlah white noise yang konsisten di latar belakang. Saya telah secara manual mendekodekan stream...
Pertanyaan saya tiga kali lipat Dalam konteks mesin dukungan vektor "Kernel" Apakah pemilihan variabel / fitur diinginkan - terutama karena kita mengatur parameter C untuk mencegah overfitting dan motif utama di balik memperkenalkan kernel ke SVM adalah untuk meningkatkan dimensi masalah, dalam...
Apakah ada sumber daya dengan daftar teknik teknik fitur? Pemetaan tipe data, model dan teknik teknik fitur akan menjadi tambang
Diterapkan Lasso untuk memeringkat fitur dan mendapatkan hasil berikut: rank feature prob. ================================== 1 a 0.1825477951589229 2 b 0.07858498115577893 3 c 0.07041793111843796 Perhatikan bahwa kumpulan data memiliki 3 label. Peringkat fitur untuk label yang berbeda...
Saya mengembangkan sistem yang dimaksudkan untuk menangkap "konteks" aktivitas pengguna dalam suatu aplikasi; ini adalah kerangka kerja yang dapat digunakan aplikasi web untuk menandai aktivitas pengguna berdasarkan permintaan yang dibuat ke sistem. Diharapkan bahwa data ini kemudian dapat...
Saya memiliki proyek klasifikasi dokumen di mana saya mendapatkan konten situs dan kemudian menugaskan salah satu dari banyak label ke situs web sesuai dengan konten. Saya menemukan bahwa tf-idf bisa sangat berguna untuk ini. Namun, saya tidak yakin kapan tepatnya menggunakannya. Dengan asumsi...