Seorang kolega dalam statistik terapan mengirimi saya ini:
"Saya bertanya-tanya apakah Anda tahu cara untuk mengetahui dimensi sebenarnya dari suatu fungsi. Misalnya, lingkaran adalah fungsi satu dimensi dalam ruang dua dimensi. Jika saya tidak tahu cara menggambar, apakah ada statistik yang dapat saya hitung yang memberi tahu saya bahwa itu adalah objek satu dimensi dalam ruang dua dimensi? Saya harus melakukan ini dalam situasi dimensi tinggi sehingga tidak dapat menggambar. Bantuan apa pun akan sangat dihargai. "
Gagasan dimensi di sini jelas tidak jelas. Maksud saya, saya dapat menjalankan kurva melalui kumpulan titik hingga dalam ruang dimensi tinggi, dan mengatakan bahwa data saya adalah satu dimensi. Namun, tergantung pada konfigurasi, mungkin ada cara yang lebih mudah atau lebih efisien untuk menggambarkan data sebagai set dimensi yang lebih tinggi.
Masalah seperti itu pasti telah dipertimbangkan dalam literatur statistik, tetapi saya tidak terbiasa dengannya. Adakah petunjuk atau saran? Terima kasih!
Analisis Komponen utama dari lokal data titik yang baik keberangkatan. Kita harus berhati-hati untuk membedakan dimensi lokal (intrinsik) dari dimensi global (ekstrinsik). Dalam contoh titik pada lingkaran, dimensi lokal adalah 1, tetapi keseluruhan titik dalam lingkaran terletak pada ruang 2D. Untuk menerapkan PCA dalam hal ini, triknya adalah melokalisasi : pilih satu titik data dan ekstrak hanya yang dekat dengannya. Terapkan PCA ke subset ini. Jumlah nilai eigen besar akan menyarankan dimensi intrinsik. Pengulangan ini pada titik data lain akan menunjukkan apakah data tersebut menunjukkan dimensi intrinsik yang konstan di seluruh. Jika demikian, masing-masing hasil PCA menyediakan atlas parsial bermacam-macam.
sumber
Saya tidak yakin tentang bagian 'domain fungsi', tetapi Dimensi Hausdorff tampaknya menjawab pertanyaan ini. Ini memiliki sifat aneh menyetujui dengan contoh sederhana ( misalnya lingkaran memiliki Dimensi 1 Hausdorff), tetapi memberikan hasil non-integral untuk beberapa set ('fraktal').
sumber
Saya sangat merekomendasikan untuk membaca survei ini: Camastra, F. (2003). Metode estimasi dimensi data: survei. Pengenalan pola , 36 (12), 2945-2954 .
Untuk melakukan estimasi ini, saya menemukan toolbox yang sangat bagus di matlab Matlab Toolbox untuk Pengurangan Dimensi . Selain teknik untuk pengurangan dimensi, kotak alat berisi implementasi 6 teknik untuk estimasi dimensi intrinsik
sumber