Dalam situasi apa kita harus menggunakan t-SNE (terlepas dari visualisasi data)?
T-SNE digunakan untuk pengurangan dimensi. Jawaban untuk pertanyaan ini menunjukkan bahwa t-SNE harus digunakan hanya untuk visualisasi dan bahwa kita tidak boleh menggunakannya untuk pengelompokan. Lalu apa gunanya t-SNE?
Jawaban:
Saya tidak setuju dengan kesimpulan ini. Tidak ada alasan untuk menganggap bahwa t-SNE secara universal lebih buruk daripada algoritma pengelompokan lainnya. Setiap algoritma pengelompokan membuat asumsi tentang struktur data, dan mereka dapat diharapkan untuk melakukan berbeda tergantung pada distribusi yang mendasarinya dan penggunaan akhir dari pengurangan dimensi.
t-SNE seperti banyak algoritma pembelajaran yang tidak diawasi sering memberikan sarana untuk mencapai tujuan, misalnya memperoleh wawasan awal tentang apakah data dapat dipisahkan atau tidak, menguji apakah ia memiliki beberapa struktur yang dapat diidentifikasi, dan memeriksa sifat struktur ini. Orang tidak perlu visualisasi dari output t-SNE untuk mulai menjawab beberapa pertanyaan ini. Aplikasi lain dari embeddings dimensi rendah termasuk fitur bangunan untuk klasifikasi atau menghilangkan multi-collinearity untuk meningkatkan kinerja metode prediksi.
sumber