Saya memiliki sampel dua kelas yang merupakan vektor dalam ruang dimensi tinggi dan saya ingin memplotnya dalam 2D atau 3D.
Saya tahu tentang teknik reduksi dimensi, tetapi saya membutuhkan alat yang sangat sederhana dan mudah digunakan (dalam matlab, python, atau prebuilt .exe).
Juga saya bertanya-tanya apakah representasi dalam 2D akan menjadi "bermakna"? (Misalnya bagaimana dua kelas berpotongan atau dapat dipisahkan).
Bagaimana dengan plot koordinat parrellel?
http://www.mathworks.com/help/stats/parallelcoords.html
sumber
Pendekatan klasik adalah dengan menggunakan PCA ( Principal Component Analysis ) untuk melakukan pengurangan dimensi linear. Pada dasarnya, ini memproyeksikan data Anda ke ruang dimensi yang lebih rendah (dalam kasus 2D ini hanyalah sebuah bidang) sambil tetap mempertahankan sebanyak mungkin varian data.
Menjalankan PCA biasanya melibatkan mengeksekusi perintah tunggal dalam sebagian besar bahasa pemrograman, sehingga sangat sederhana.
Anda harus ingat bahwa ada kemungkinan bahwa data Anda tidak dapat direpresentasikan secara akurat dalam 2 atau 3 dimensi. PCA secara otomatis akan memberi Anda perkiraan kuantitatif tentang ini: Ini akan memberi tahu Anda berapa persen varians yang ditangkap oleh representasi dimensi rendah yang dihasilkan. Ini akan memberi Anda perasaan tentang berapa banyak informasi yang hilang dengan melihat visualisasi yang disederhanakan ini.
sumber
Hanya untuk menambahkan 5 sen saya. Perpustakaan python Scikit-Learn memiliki banyak algoritma untuk ini:
http://scikit-learn.org/stable/auto_examples/manifold/plot_compare_methods.html#example-manifold-plot-compare-methods-py
sumber
Pertimbangkan contoh berikut untuk opsi tampilan. http://www.mathworks.com/help/stats/gmdistribution.cluster.html
sumber
Selain saran @ juampa, Anda juga harus mencoba NeRV (Neighbor Retrieval Visualizer), yang " merupakan pendekatan berbasis pencarian informasi untuk pengurangan dimensi nonlinier ", dan SNE / t-SNE dapat dilihat sebagai kasus khusus NeRV. Poin utama dari NeRV adalah untuk meminimalkan tradeoff dari penarikan dan presisi antara ruang asli dan tampilan. NeRV disediakan sebagai alat baris perintah yang ditulis dalam C ++.
Gambar demo dari situs web mereka: hasil di sebelah kiri lebih menekankan pada ingatan (lebih sedikit "kehilangan"), sedangkan yang kanan lebih menekankan pada ketepatan (lebih sedikit "tetangga palsu").
sumber
Jika Anda tidak keberatan dengan perangkat lunak komersial, Anda dapat mencoba perangkat lunak VisuMap yang mengimplementasikan puluhan algoritma pemetaan linear dan non-linear untuk data dimensi tinggi, termasuk metode seperti PCA, LDA, SMACOF, tSNE, CCA, Sammon, Peta Kohonen, dll.
sumber