Saya perlu menyelesaikan masalah regresi yang rumit pada unit disk. Pertanyaan aslinya menarik beberapa komentar menarik, tetapi sayangnya tidak ada jawaban. Sementara itu, saya belajar lebih banyak tentang masalah ini, jadi saya akan mencoba untuk membagi masalah asli menjadi submasalah, dan melihat apakah saya lebih beruntung kali ini.
Saya memiliki 40 sensor suhu yang ditempatkan secara teratur di cincin sempit di dalam unit disk:
Sensor-sensor ini memperoleh suhu dalam waktu. Namun, karena variasi waktu jauh lebih kecil daripada variasi ruang, mari kita sederhanakan masalahnya dengan mengabaikan variabilitas waktu, dan anggap setiap sensor hanya memberi saya rata-rata waktu. Ini berarti bahwa saya memiliki 40 sampel (satu untuk setiap sensor) dan saya tidak memiliki sampel berulang.
Setelah model dipilih, saya harus memilih prosedur estimasi. Karena ini adalah masalah regresi spasial, kesalahan di lokasi yang berbeda harus dikorelasikan. Kuadrat Terkecil Biasa mengasumsikan kesalahan tidak berkorelasi, jadi saya kira Generalized Least Squares akan lebih tepat. GLS tampaknya teknik statistik yang relatif umum, mengingat bahwa ada gls
fungsi dalam distribusi R standar. Namun, saya tidak pernah menggunakan GLS, dan saya ragu. Sebagai contoh, bagaimana cara memperkirakan matriks kovarians? Sebuah contoh yang berhasil, bahkan hanya dengan beberapa sensor, akan sangat bagus.
PS Saya memilih untuk menggunakan polinomial dan GLS Zernike karena menurut saya hal yang logis untuk dilakukan di sini. Namun saya bukan ahli, dan jika Anda merasa saya akan ke arah yang salah, jangan ragu untuk menggunakan pendekatan yang sama sekali berbeda.
sumber
Jawaban:
Saya pikir Anda berada di jalur yang benar dalam memikirkan sesuatu seperti polinomial Zernike. Seperti dicatat dalam jawaban oleh jwimberly, ini adalah contoh dari sistem fungsi dasar ortogonal pada disk. Saya tidak terbiasa dengan polinomial Zernike, tetapi banyak keluarga fungsi ortogonal lainnya (termasuk fungsi Bessel) muncul secara alami dalam fisika matematika klasik sebagai fungsi eigen untuk persamaan diferensial parsial tertentu (pada saat penulisan ini, animasi di bagian atas tautan itu bahkan menunjukkan contoh kepala drum yang bergetar).
Dalam hal pertanyaan kedua ini, variabilitas data sebenarnya bisa membantu dengan masalah aliasing apa pun, yang pada dasarnya memungkinkan kesalahan penyelarasan untuk pengukuran yang berbeda. (Dengan asumsi tidak ada bias sistematis ... tapi itu akan menjadi masalah untuk metode apa pun, tanpa misalnya model fisik untuk memberikan informasi lebih lanjut).
Jadi satu kemungkinan adalah untuk menentukan fungsi ortogonal spasial Anda murni di lokasi sensor. Ini "Empiris Orthogonal Fungsi" dapat dihitung melalui PCA pada matriks data yang spatiotemporal Anda. (Mungkin Anda bisa menggunakan pembobotan untuk memperhitungkan area pendukung sensor variabel, tetapi mengingat kisi polar yang seragam dan target rata-rata radial, ini mungkin tidak diperlukan.)
Perhatikan bahwa jika ada yang data pemodelan fisik yang tersedia untuk "diharapkan" variasi suhu, yang tersedia di grid komputasi spatiotemporal padat, maka prosedur PCA yang sama dapat diterapkan untuk yang data ke fungsi ortogonal Derive. (Ini biasanya disebut " Dekomposisi Orthogonal Yang Tepat " dalam rekayasa, di mana ia digunakan untuk pengurangan model, misalnya model dinamika fluida komputasi yang mahal dapat didistilasi untuk digunakan dalam kegiatan desain lebih lanjut.)
Komentar terakhir, jika Anda mempertimbangkan data sensor berdasarkan area pendukung (yaitu ukuran sel polar), ini akan menjadi jenis kovarians diagonal, dalam kerangka GLS . (Itu akan berlaku untuk masalah prediksi Anda lebih banyak, meskipun PCA tertimbang akan terkait erat.)
Saya harap ini membantu!
Pembaruan: Diagram baru distribusi sensor Anda mengubah banyak hal dalam pandangan saya. Jika Anda ingin memperkirakan suhu pada interior disk, Anda akan memerlukan informasi yang jauh lebih informatif daripada sekadar "mengatur fungsi ortogonal pada disk unit". Terlalu sedikit informasi dalam data sensor.
Jika Anda memang ingin memperkirakan variasi suhu spasial di atas disk, satu-satunya cara yang masuk akal yang dapat saya lihat adalah memperlakukan masalah tersebut sebagai salah satu asimilasi data . Di sini Anda perlu setidaknya membatasi bentuk parametrik dari distribusi spasial berdasarkan beberapa pertimbangan berbasis fisika (ini bisa dari simulasi, atau bisa dari data terkait dalam sistem dengan dinamika yang serupa).
Saya tidak tahu aplikasi khusus Anda, tetapi jika itu adalah sesuatu seperti ini , maka saya akan membayangkan ada literatur teknik yang luas yang dapat Anda gunakan untuk memilih kendala sebelumnya yang sesuai. (Untuk pengetahuan domain terperinci semacam itu, ini mungkin bukan situs StackExchange terbaik untuk ditanyakan.)
sumber
sumber