Saya mencoba untuk memahami perbedaan antara metode reduksi dimensionalitas linier (misalnya, PCA) dan yang nonlinier (misalnya, Isomap).
Saya tidak begitu mengerti apa arti linearitas (non) dalam konteks ini. Saya membaca dari Wikipedia itu
Sebagai perbandingan, jika PCA (algoritma reduksi dimensionalitas linier) digunakan untuk mengurangi dataset yang sama ini menjadi dua dimensi, nilai-nilai yang dihasilkan tidak tertata dengan baik. Ini menunjukkan bahwa vektor berdimensi tinggi (masing-masing mewakili huruf 'A') yang mengambil sampel manifold ini bervariasi secara non-linear.
Apa tidak
vektor-vektor berdimensi tinggi (masing-masing mewakili huruf 'A') yang mengambil sampel manifold ini bervariasi secara non-linear.
berarti? Atau lebih luas lagi, bagaimana saya memahami linearitas (non) dalam konteks ini?
sumber
Sebuah gambar bernilai ribuan kata:
Di sini kita mencari struktur 1 dimensi dalam 2D. Titik-titiknya terletak di sepanjang kurva berbentuk S. PCA mencoba menggambarkan data dengan manifold 1 dimensi linier , yang hanya berupa garis; tentu saja garis yang cocok dengan data ini sangat buruk. Isomap mencari manifold 1-dimensi nonlinear (yaitu melengkung!), Dan harus dapat menemukan kurva berbentuk S yang mendasarinya.
sumber