Sejauh yang saya tahu, kedua autoencoder dan t-SNE digunakan untuk pengurangan dimensi nonlinier. Apa perbedaan di antara mereka dan mengapa saya harus menggunakan satu versus yang lain?
12
Sejauh yang saya tahu, kedua autoencoder dan t-SNE digunakan untuk pengurangan dimensi nonlinier. Apa perbedaan di antara mereka dan mengapa saya harus menggunakan satu versus yang lain?
Keduanya mencoba menemukan penyematan dimensi data Anda yang lebih rendah. Namun, ada berbagai masalah minimisasi. Lebih khusus lagi, autoencoder mencoba untuk meminimalkan kesalahan rekonstruksi, sementara t-SNE mencoba untuk menemukan ruang dimensi yang lebih rendah dan pada saat yang sama mencoba untuk melestarikan jarak lingkungan. Sebagai hasil dari atribut ini, t-SNE biasanya lebih disukai untuk plot dan visualisasi.
Dari "Mempelajari Penanaman Parametrik dengan Melestarikan Struktur Lokal", Laurens van der Maaten ( https://lvdmaaten.github.io/publications/papers/AISTATS_2009.pdf )
sumber
Autoencoder dan t-SNE dapat digunakan bersama untuk visualisasi yang lebih baik dalam data dimensi tinggi, seperti yang dijelaskan dalam [1]:
[1] https://blog.keras.io/building-autoencoders-in-keras.html
sumber
Autoencoder dirancang untuk menyimpan data sebelumnya dalam arti 2-norma, yang dapat dianggap sebagai melestarikan energi kinetik data, jika data kecepatan.
Sementara t-SNE, menggunakan KL divergence yang tidak simetris, itu akan menyebabkan t-SNE lebih fokus pada struktur lokal, sementara autoencoder cenderung menjaga kesalahan L2 keseluruhan kecil, yang dalam arti global.
sumber