Bagaimana perbedaan PCA dan MDS klasik? Bagaimana dengan MDS versus MDS non-metrik? Apakah ada saat ketika Anda lebih suka yang satu daripada yang lain? Bagaimana perbedaan
Teknik yang membuat kemiripan yang diamati atau dihitung (dis) antar objek menjadi jarak dalam ruang berdimensi rendah (biasanya Euclidean). Dengan demikian, ia membangun dimensi untuk data; objek dapat diplot dan dikonseptualisasikan dalam dimensi tersebut
Bagaimana perbedaan PCA dan MDS klasik? Bagaimana dengan MDS versus MDS non-metrik? Apakah ada saat ketika Anda lebih suka yang satu daripada yang lain? Bagaimana perbedaan
Praktek umum yang baik dalam Pembelajaran Mesin adalah melakukan normalisasi fitur atau standardisasi data dari variabel prediktor, hanya itu, pusatkan data dengan mengurangkan rata-rata dan menormalkannya dengan varian (atau standar deviasi juga). Untuk pengendalian diri dan pemahaman saya, kami...
Saya mencoba untuk memprediksi hasil dari sistem yang kompleks menggunakan jaringan saraf (JST). Nilai hasil (tergantung) berkisar antara 0 dan 10.000. Variabel input yang berbeda memiliki rentang yang berbeda. Semua variabel memiliki distribusi normal. Saya mempertimbangkan berbagai opsi untuk...
Untuk LASSO (dan prosedur pemilihan model lainnya), sangat penting untuk mengubah skala prediktor. The umum Rekomendasi saya tindak hanya menggunakan 0 berarti, 1 standar deviasi normalisasi untuk variabel kontinyu. Tapi apa yang harus dilakukan dengan boneka? Misalnya beberapa contoh terapan dari...
Telah membaca beberapa pertanyaan tentang t-SNE ( t-Distributed Stochastic Neighbor Embedding ) belakangan ini, dan juga mengunjungi beberapa pertanyaan tentang MDS ( Multidimensional Scaling ). Mereka sering digunakan secara analog, jadi sepertinya ide yang bagus membuat pertanyaan ini melihat...
Pemahaman saya tentang t-SNE dan pendekatan Barnes-Hut adalah bahwa semua titik data diperlukan sehingga semua interaksi gaya dapat dihitung pada waktu yang sama dan setiap titik dapat disesuaikan dalam peta 2d (atau dimensi yang lebih rendah). Apakah ada versi t-sne yang secara efisien dapat...
Saya baru-baru ini menemukan skala multidimensi. Saya mencoba memahami alat ini dengan lebih baik dan perannya dalam statistik modern. Jadi, inilah beberapa pertanyaan panduan: Pertanyaan apa yang dijawabnya? Peneliti mana yang sering tertarik menggunakannya? Apakah ada teknik statistik lain yang...
Saya menggunakan randomForest untuk mengklasifikasikan 6 perilaku hewan (mis. Berdiri, Berjalan, Berenang dll) berdasarkan 8 variabel (postur tubuh dan gerakan yang berbeda). MDSplot dalam paket randomForest memberi saya hasil ini dan saya memiliki masalah dalam menafsirkan hasilnya. Saya...
Saya ingin mengelompokkan dataset besar yang saya hanya memiliki jarak berpasangan. Saya menerapkan algoritma k-medoid, tetapi butuh waktu terlalu lama untuk dijalankan sehingga saya ingin memulai dengan mengurangi dimensi masalah saya dengan menerapkan PCA. Namun, satu-satunya cara saya tahu untuk...
Saya menggunakan pengindeksan semantik laten untuk menemukan kesamaan antara dokumen ( terima kasih, JMS! ) Setelah pengurangan dimensi, saya sudah mencoba k-means clustering untuk mengelompokkan dokumen menjadi cluster, yang berfungsi dengan sangat baik. Tapi saya ingin melangkah lebih jauh, dan...
Saya memiliki satu set titik data dalam ruang dimensi N. Selain itu, saya juga memiliki centroid di ruang dimensi-N yang sama. Apakah ada pendekatan yang dapat memungkinkan saya untuk memproyeksikan titik data ini ke ruang dua dimensi sambil menjaga informasi jarak relatif mereka di ruang asli....
Menurut "Efficient Backprop" oleh LeCun et al (1998) adalah praktik yang baik untuk menormalkan semua input sehingga mereka berpusat di sekitar 0 dan berada dalam kisaran turunan maksimum kedua. Jadi misalnya kita akan menggunakan [-0,5,0,5] untuk fungsi "Tanh". Ini untuk membantu perkembangan...
Mempertimbangkan jumlah fitur yang konstan, Barnes-Hut t-SNE memiliki kompleksitas , proyeksi acak dan PCA memiliki kompleksitas menjadikannya "terjangkau" untuk set data yang sangat besar.O ( n logn )HAI(ncatatann)O(n\log n)O ( n )HAI(n)O(n) Di sisi lain, metode yang mengandalkan penskalaan...