Regresi pada disk unit mulai dari sampel "spasi seragam"

9

Saya perlu menyelesaikan masalah regresi yang rumit pada unit disk. Pertanyaan aslinya menarik beberapa komentar menarik, tetapi sayangnya tidak ada jawaban. Sementara itu, saya belajar lebih banyak tentang masalah ini, jadi saya akan mencoba untuk membagi masalah asli menjadi submasalah, dan melihat apakah saya lebih beruntung kali ini.

Saya memiliki 40 sensor suhu yang ditempatkan secara teratur di cincin sempit di dalam unit disk: masukkan deskripsi gambar di sini

Sensor-sensor ini memperoleh suhu dalam waktu. Namun, karena variasi waktu jauh lebih kecil daripada variasi ruang, mari kita sederhanakan masalahnya dengan mengabaikan variabilitas waktu, dan anggap setiap sensor hanya memberi saya rata-rata waktu. Ini berarti bahwa saya memiliki 40 sampel (satu untuk setiap sensor) dan saya tidak memiliki sampel berulang.

T=f(ρ,θ)+ϵ

  1. Tmean=g1(ρ)+ϵθ
  2. T95=g2(ρ)+ϵP(T(ρ)<T95(ρ))=.95

θ

Setelah model dipilih, saya harus memilih prosedur estimasi. Karena ini adalah masalah regresi spasial, kesalahan di lokasi yang berbeda harus dikorelasikan. Kuadrat Terkecil Biasa mengasumsikan kesalahan tidak berkorelasi, jadi saya kira Generalized Least Squares akan lebih tepat. GLS tampaknya teknik statistik yang relatif umum, mengingat bahwa ada glsfungsi dalam distribusi R standar. Namun, saya tidak pernah menggunakan GLS, dan saya ragu. Sebagai contoh, bagaimana cara memperkirakan matriks kovarians? Sebuah contoh yang berhasil, bahkan hanya dengan beberapa sensor, akan sangat bagus.

PS Saya memilih untuk menggunakan polinomial dan GLS Zernike karena menurut saya hal yang logis untuk dilakukan di sini. Namun saya bukan ahli, dan jika Anda merasa saya akan ke arah yang salah, jangan ragu untuk menggunakan pendekatan yang sama sekali berbeda.

DeltaIV
sumber
θ

Jawaban:

2

Saya pikir Anda berada di jalur yang benar dalam memikirkan sesuatu seperti polinomial Zernike. Seperti dicatat dalam jawaban oleh jwimberly, ini adalah contoh dari sistem fungsi dasar ortogonal pada disk. Saya tidak terbiasa dengan polinomial Zernike, tetapi banyak keluarga fungsi ortogonal lainnya (termasuk fungsi Bessel) muncul secara alami dalam fisika matematika klasik sebagai fungsi eigen untuk persamaan diferensial parsial tertentu (pada saat penulisan ini, animasi di bagian atas tautan itu bahkan menunjukkan contoh kepala drum yang bergetar).

θ

rT95

Dalam hal pertanyaan kedua ini, variabilitas data sebenarnya bisa membantu dengan masalah aliasing apa pun, yang pada dasarnya memungkinkan kesalahan penyelarasan untuk pengukuran yang berbeda. (Dengan asumsi tidak ada bias sistematis ... tapi itu akan menjadi masalah untuk metode apa pun, tanpa misalnya model fisik untuk memberikan informasi lebih lanjut).

Jadi satu kemungkinan adalah untuk menentukan fungsi ortogonal spasial Anda murni di lokasi sensor. Ini "Empiris Orthogonal Fungsi" dapat dihitung melalui PCA pada matriks data yang spatiotemporal Anda. (Mungkin Anda bisa menggunakan pembobotan untuk memperhitungkan area pendukung sensor variabel, tetapi mengingat kisi polar yang seragam dan target rata-rata radial, ini mungkin tidak diperlukan.)

Perhatikan bahwa jika ada yang data pemodelan fisik yang tersedia untuk "diharapkan" variasi suhu, yang tersedia di grid komputasi spatiotemporal padat, maka prosedur PCA yang sama dapat diterapkan untuk yang data ke fungsi ortogonal Derive. (Ini biasanya disebut " Dekomposisi Orthogonal Yang Tepat " dalam rekayasa, di mana ia digunakan untuk pengurangan model, misalnya model dinamika fluida komputasi yang mahal dapat didistilasi untuk digunakan dalam kegiatan desain lebih lanjut.)

Komentar terakhir, jika Anda mempertimbangkan data sensor berdasarkan area pendukung (yaitu ukuran sel polar), ini akan menjadi jenis kovarians diagonal, dalam kerangka GLS . (Itu akan berlaku untuk masalah prediksi Anda lebih banyak, meskipun PCA tertimbang akan terkait erat.)

Saya harap ini membantu!

Pembaruan: Diagram baru distribusi sensor Anda mengubah banyak hal dalam pandangan saya. Jika Anda ingin memperkirakan suhu pada interior disk, Anda akan memerlukan informasi yang jauh lebih informatif daripada sekadar "mengatur fungsi ortogonal pada disk unit". Terlalu sedikit informasi dalam data sensor.

Jika Anda memang ingin memperkirakan variasi suhu spasial di atas disk, satu-satunya cara yang masuk akal yang dapat saya lihat adalah memperlakukan masalah tersebut sebagai salah satu asimilasi data . Di sini Anda perlu setidaknya membatasi bentuk parametrik dari distribusi spasial berdasarkan beberapa pertimbangan berbasis fisika (ini bisa dari simulasi, atau bisa dari data terkait dalam sistem dengan dinamika yang serupa).

Saya tidak tahu aplikasi khusus Anda, tetapi jika itu adalah sesuatu seperti ini , maka saya akan membayangkan ada literatur teknik yang luas yang dapat Anda gunakan untuk memilih kendala sebelumnya yang sesuai. (Untuk pengetahuan domain terperinci semacam itu, ini mungkin bukan situs StackExchange terbaik untuk ditanyakan.)

GeoMatt22
sumber
Jawaban yang mengesankan! Perlu waktu untuk mencernanya. Anda mengajukan dua pertanyaan: Saya tidak yakin saya mengerti yang pertama ("berapa banyak batasan pada pola spasial yang Anda butuhkan?") Saya berpikir bahwa menggunakan data dari semua 40 sensor akan lebih baik daripada hanya rata-rata sepanjang arah melingkar dan kemudian pas ... apakah Anda mengatakan ini belum tentu benar? Untuk yang kedua ("apa jenis variabilitas yang terjadi dalam data spatio-temporal"), dalam satu atau dua hari ke depan saya akan menganalisis mesin pertama (saya benar-benar memiliki 5 dari mereka! Tapi ini akan menjadi topik dari pertanyaan masa depan ...)
ctd
... ctd, saya akan menormalkan data dan saya akan melihat apa yang bisa saya publikasikan di situs publik. Beberapa pola spasial dan serangkaian waktu ... Saya pikir mereka harus memberi Anda gagasan tentang apa yang Anda tanyakan.
DeltaIV
1
T95
1
BTW jika ini adalah masalah desain, dan ada simulasi tipe CFD terkait, maka itu secara signifikan lebih banyak informasi daripada tersirat oleh pertanyaan saat ini. (Misalnya, mendekati masalah karena asimilasi data mungkin menggunakan pendekatan yang berbeda.)
GeoMatt22
Jawaban Anda membuat saya berpikir: alih-alih regresi, adakah yang setara dengan transformasi Fourier diskrit yang dapat dilakukan? Misalnya mengambil titik integral dari data kali fungsi Bessel ke-n (dimodifikasi dengan tepat), dan kemudian mendapatkan dekomposisi ortogonal? Kekhawatiran di sini adalah 1) menemukan fungsi diskrit yang sesuai, mungkin di sepanjang baris yang sama dengan jawaban Anda, dan 2) apakah ini akan terlalu sensitif terhadap sejumlah kecil titik pengambilan sampel dan dekomposisi akan bersandar pada persyaratan urutan lebih tinggi yang lebih rumit .
jwimberley
2

rθ

jwimberley
sumber
(+1) Koneksi persamaan panas kutub-koordinat bagus. Satu lagi mungkin layak disebutkan adalah bahwa untuk Proses Gaussian saya tahu secara umum pada grid persegi panjang matriks kovarian adalah sirkuler, dan praktis FFT digunakan. Jadi fungsi Bessel akan menjadi kandidat yang mungkin untuk pendekatan serupa di kotak kutub.
GeoMatt22
Saran yang menarik! Namun, saya mengukur suhu di fluida operasi, bukan di bagian padat mesin. Jadi saya tertarik pada masalah konveksi, yang bertentangan dengan masalah konduksi. Fungsi Bessel jelas merupakan solusi dari persamaan konduksi panas (Fourier), tetapi saya tidak berpikir mereka adalah solusi dari persamaan konveksi panas juga, karena konveksi tergantung pada bidang aliran fluida. Ngomong-ngomong, aku setidaknya bisa mengujinya vs Zernike. Bagaimana dengan GLS? Bisakah Anda menambahkan sesuatu pada bagian pertanyaan itu juga?
DeltaIV
@DeltaIV Saya tidak terlalu terbiasa dengan GLS, tetapi satu pertanyaan - mengapa Anda berharap kesalahan dikorelasikan pada titik spasial yang berbeda? Saya setuju bahwa fluktuasi nyata akan berkorelasi antara poin, tetapi saya akan berpikir bahwa kesalahan (yaitu ketidakpastian dalam pembacaan sensor) akan tidak berkorelasi. Mungkin fluktuasi regresi dihitung sebagai kesalahan? Saya mempertimbangkan untuk menambahkan sesuatu tentang ketentuan hukuman. Apa pun dasar yang Anda gunakan, Anda hanya memiliki jumlah titik pengambilan sampel yang terbatas dan dapat menemukan beberapa fungsi Bessel pencocokan pesanan sangat tinggi, sehingga syarat pesanan terendah harus dipilih.
jwimberley
@DeltaIV Mengenai fluktuasi lagi, yang akan memperkenalkan korelasi antara titik-titik spasial: objek Anda adalah untuk mendapatkan peta suhu, bukan? Tidakkah Anda ingin melihat fluktuasi apa pun yang terjadi? Dan dapatkah model statistik bahkan menjelaskannya, karena fluktuasi akan didorong oleh dinamika fluida dan rumit dalam ruang dan waktu? (Apakah ini terkait dengan bagian waktu yang bergantung pada analisis Anda yang Anda tinggalkan untuk kesederhanaan?)
jwimberley
obrolan galeri dibuat .
DeltaIV