Dalam teknik reduksi dimensionalitas seperti Principal Component Analysis, LDA dll sering istilah manifold digunakan. Apa yang banyak ragam dalam istilah non-teknis? Jika suatu titik milik bola yang dimensi yang ingin saya kurangi, dan jika ada suara dan dan tidak berkorelasi, maka titik sebenarnya akan jauh terpisah satu sama lain karena kebisingan. Oleh karena itu, penyaringan kebisingan akan diperlukan. Jadi, pengurangan dimensi akan dilakukan pada . Oleh karena itu, di sini apakah dan milik manifold berbeda?y x y x
Saya sedang mengerjakan data cloud titik yang sering digunakan dalam penglihatan robot; awan titik berisik karena kebisingan dalam akuisisi dan saya perlu mengurangi kebisingan sebelum pengurangan dimensi. Kalau tidak, saya akan mendapatkan pengurangan dimensi yang salah. Jadi, apakah manifold di sini dan apakah noise merupakan bagian dari manifold yang sama dengan yang dimiliki ?
sumber
Jawaban:
Dalam istilah non teknis, manifold adalah struktur geometri kontinu yang memiliki dimensi terbatas: garis, kurva, bidang, permukaan, bola, bola, silinder, torus, "gumpalan" ... sesuatu seperti ini :
Ini adalah istilah umum yang digunakan oleh matematikawan untuk mengatakan "kurva" (dimensi 1) atau "permukaan" (dimensi 2), atau objek 3D (dimensi 3) ... untuk kemungkinan dimensi hingga . Manifold satu dimensi hanyalah sebuah kurva (garis, lingkaran ...). Manifold dua dimensi hanyalah sebuah permukaan (bidang, bola, torus, silinder ...). Manifold tiga dimensi adalah "objek penuh" (bola, kubus penuh, ruang 3D di sekitar kita ...).n
Manifold sering digambarkan dengan persamaan: himpunan titik seperti adalah manifold satu dimensi (lingkaran).x 2 + y 2 = 1( x , y) x2+ y2= 1
Manifold memiliki dimensi yang sama di mana-mana. Misalnya, jika Anda menambahkan garis (dimensi 1) ke bola (dimensi 2) maka struktur geometris yang dihasilkan bukan bermacam-macam.
Berbeda dengan gagasan yang lebih umum tentang ruang metrik atau ruang topologi yang juga dimaksudkan untuk menggambarkan intuisi alami kita tentang serangkaian titik kontinu, manifold dimaksudkan untuk menjadi sesuatu yang sederhana secara lokal: seperti ruang vektor dimensi terbatas: . Ini mengesampingkan ruang abstrak (seperti ruang dimensi tak terbatas) yang sering gagal memiliki makna konkrit geometris.Rn
Tidak seperti ruang vektor, manifold dapat memiliki berbagai bentuk. Beberapa manifold dapat dengan mudah divisualisasikan (bola, bola ...), beberapa sulit divisualisasikan, seperti botol Klein atau bidang proyektif yang sebenarnya .
Dalam statistik, pembelajaran mesin, atau matematika terapan secara umum, kata "berjenis" sering digunakan untuk mengatakan "seperti ruang bagian linear" tetapi mungkin melengkung. Setiap kali Anda menulis persamaan linear seperti: Anda mendapatkan subruang linier (affine) (di sini pesawat). Biasanya, ketika persamaannya tidak linier seperti , ini adalah manifold (di sini bidang yang diregangkan).x 2 + 2 y 2 + 3 z 2 = 73 x + 2 y- 4 z= 1 x2+ 2 y2+ 3 z2= 7
Sebagai contoh " hipotesis berjenis " dari ML mengatakan "data dimensi tinggi adalah titik dalam manifold dimensi rendah dengan noise dimensi tinggi ditambahkan". Anda dapat membayangkan titik-titik lingkaran 1D dengan beberapa noise 2D ditambahkan. Sementara poin tidak tepat pada lingkaran, mereka memenuhi secara statistik persamaan . Lingkaran adalah bermacam-macam yang mendasarinya:x2+ y2= 1
sumber
Perhatikan bahwa untuk membuat "struktur" tepat di sini, kita perlu memahami pengertian dasar topologi ( def. ), Yang memungkinkan seseorang untuk membuat gagasan yang tepat tentang perilaku "lokal" , dan dengan demikian "secara lokal" di atas. Ketika saya mengatakan "ekuivalen", yang saya maksud adalah struktur topologi yang ekuivalen ( homeomorfik ), dan ketika saya mengatakan "pelestarian struktur" yang saya maksud adalah hal yang sama (menciptakan struktur topologi yang setara).
Perhatikan juga bahwa untuk melakukan kalkulus pada manifold , seseorang membutuhkan kondisi tambahan yang tidak mengikuti dari dua kondisi di atas, yang pada dasarnya mengatakan sesuatu seperti "grafik cukup baik untuk memungkinkan kita melakukan kalkulus". Ini adalah manifold yang paling sering digunakan dalam praktik. Tidak seperti manifold topologi umum , selain kalkulus mereka juga memungkinkan triangulasi , yang sangat penting dalam aplikasi seperti milik Anda yang melibatkan data titik awan .
Perhatikan bahwa tidak semua orang menggunakan definisi yang sama untuk bermacam-macam (topologi). Beberapa penulis akan mendefinisikannya sebagai satu-satunya syarat yang memuaskan (1) di atas, tidak harus juga (2). Namun, definisi yang memenuhi keduanya (1) dan (2) jauh lebih baik berperilaku, oleh karena itu lebih bermanfaat bagi para praktisi. Seseorang mungkin berharap secara intuitif bahwa (1) menyiratkan (2), tetapi sebenarnya tidak.
sumber
Dalam konteks ini, istilah manifold akurat, tetapi tidak perlu terlalu tinggi. Secara teknis, manifold adalah setiap ruang (set poin dengan topologi) yang cukup halus dan kontinu (dengan cara yang dapat, dengan beberapa upaya, dibuat secara matematis didefinisikan dengan baik).
Bayangkan ruang semua nilai yang mungkin dari faktor asli Anda. Setelah teknik reduksi dimensi, tidak semua titik di ruang itu dapat dicapai. Sebagai gantinya, hanya menunjuk pada beberapa sub-ruang tertanam di dalam dalam ruang itu yang akan dapat dicapai. Sub-ruang yang tertanam terjadi untuk memenuhi definisi matematika dari bermacam-macam. Untuk teknik reduksi dimensi linier seperti PCA, sub-ruang itu hanyalah sub-ruang linier (misalnya bidang-hiper), yang merupakan manifold yang relatif sepele. Tetapi untuk teknik reduksi dimensi non-linear, sub-ruang itu bisa lebih rumit (misalnya permukaan-melengkung). Untuk keperluan analisis data, memahami bahwa ini adalah sub-ruang jauh lebih penting daripada kesimpulan yang Anda dapat dari mengetahui bahwa mereka memenuhi definisi bermacam-macam.
sumber