Keuntungan utama dari model proses Gaussian

11

Proses Gaussian telah banyak digunakan, terutama dalam persaingan. Diketahui bahwa permintaan komputasi tinggi ( ).0(n3)

  1. Apa yang membuat mereka populer?
  2. Apa keunggulan utama dan tersembunyi mereka?
  3. Mengapa mereka digunakan sebagai pengganti model parametrik (oleh model parametrik maksud saya regresi linier khas di mana bentuk parametrik yang berbeda dapat digunakan untuk menggambarkan tren input vs output; misalnya, qaudratic)?

Saya akan sangat menghargai jawaban teknis yang menjelaskan sifat-sifat yang melekat yang membuat proses Gaussian unik dan menguntungkan

Wis
sumber
Bisakah Anda mengklarifikasi apa yang Anda maksud dengan model parametrik?
Alexey Zaytsev
@ Alexey Saya telah menjelaskan apa yang saya maksud dengan model paramtric di atas. Terima kasih
Wis
Dari apa yang saya asumsikan tentang model parametrik Anda perlu menentukan model dengan tangan untuk setiap masalah. Ini tidak selalu mungkin, karena sifat sejati tidak selalu diketahui. Selain itu, mungkin ada kesulitan dengan pemasangan model ini, sedangkan untuk proses estimasi parameter Gaussian bekerja dengan baik hampir setiap waktu.
Alexey Zaytsev
4
Splines dan regresi linier setara dengan regresi proses Gaussian dengan fungsi kovarian yang tepat dipilih. Tetapi proses Gaussian memberikan kerangka kerja probabilistik yang nyaman dan cocok untuk banyak tugas.
Alexey Zaytsev
1
Kapan Anda tidak akan menggunakan Proses Gaussian?
Alby

Jawaban:

6

Keuntungan utama adalah dari sudut pandang teknik (seperti yang disebutkan @Alexey). Dalam prosedur Kriging yang banyak digunakan, Anda dapat menafsirkan "ruang" Anda sendiri dengan memberikan model "korelasi" (atau kovarian) (biasanya disebut variogram ellipsoid ) untuk hubungan tergantung pada jarak dan orientasi.

Tidak ada yang mencegah metodologi lain untuk memiliki fitur yang sama, kebetulan bahwa cara kriging pertama kali dikonseptualisasikan memiliki pendekatan ramah kepada orang-orang yang bukan ahli statistik.

Saat ini dengan munculnya metodologi stokastik berbasis geostatistik, seperti Sequential Gaussian Simulation antara lain , prosedur ini mulai digunakan di sektor-sektor di mana penting untuk mendefinisikan ruang ketidakpastian (yang dapat mengambil ribuan hingga jutaan dimensi). Sekali lagi, dari sudut pandang teknik, algoritma berbasis geostatistik sangat mudah untuk dimasukkan dalam pemrograman genetik . Karena itu ketika Anda memiliki masalah terbalik, Anda harus dapat menguji beberapa skenario dan menguji kemampuannya untuk fungsi optimisasi Anda.

Mari kita tinggalkan argumentasi murni sejenak dan nyatakan fakta untuk contoh nyata modern dari penggunaan ini. Anda dapat mengambil sampel sampel bawah tanah secara langsung (data keras) atau membuat peta seismik dari bawah permukaan (data lunak).

Dalam data keras, Anda dapat mengukur properti (misalkan impedansi akustik) secara langsung tanpa kesalahan (ish). Masalahnya adalah ini langka (dan mahal). Di sisi lain Anda memiliki pemetaan seismik yang secara harfiah volume, pixel-bijaksana, peta bawah permukaan tetapi tidak memberi Anda impedansi akustik. Untuk tujuan kesederhanaan katakanlah itu memberi Anda rasio antara dua nilai impedansi akustik (atas dan bawah). Jadi rasio 0,5 dapat berupa pembagian 1000/2000 atau 10 000/20 000. Ini adalah ruang solusi berganda dan beberapa kombinasi akan melakukan tetapi hanya satu yang secara akurat mewakili kenyataan. Bagaimana anda menyelesaikan ini?

Cara inversi seismik bekerja (prosedur stokastik) adalah dengan menghasilkan skenario yang masuk akal (dan ini adalah cerita lain bersama-sama), impedansi akustik (atau properti lainnya), mengubah skenario tersebut menjadi seismik sintetis (seperti rasio pada contoh sebelumnya) dan membandingkan seismik sintetis dengan yang asli (korelasi). Skenario terbaik akan digunakan untuk menghasilkan lebih banyak skenario, konvergen menjadi solusi (ini tidak semudah kelihatannya).

Dengan mempertimbangkan hal ini dan berbicara dari sudut pandang kegunaan, saya akan menjawab pertanyaan Anda dengan cara berikut:

1) Apa yang membuat mereka populer adalah kegunaan, fleksibilitas dalam implementasi, sejumlah pusat penelitian dan institusi yang terus membuat prosedur berbasis gaussian yang lebih baru dan lebih mudah beradaptasi untuk beberapa bidang yang berbeda (khususnya dalam geosains, termasuk SIG).

2) Keuntungan utama adalah , seperti yang disebutkan sebelumnya, kegunaan dan fleksibilitas dari sudut pandang saya. Jika mudah dimanipulasi dan mudah digunakan, lakukan saja. Tidak ada fitur khusus dalam proses gaussian yang tidak dapat direproduksi dalam metodologi lain (statistik atau sebaliknya).

3) Mereka digunakan ketika Anda perlu memasukkan lebih banyak informasi ke dalam model Anda daripada hanya data (informasi tersebut memiliki hubungan yang bijaksana, distribusi statistik, dan sebagainya ...). Saya dapat meyakinkan bahwa jika Anda memiliki banyak data dengan perilaku isotropik menggunakan kriging adalah buang-buang waktu. Anda bisa mendapatkan hasil yang sama menggunakan metode lain yang dengan membutuhkan lebih sedikit informasi, lebih cepat dijalankan.

armatita
sumber
Dan kapan model lain merupakan pilihan yang lebih baik?
Ben
1
@ Ben Itu akan selalu tergantung pada studi kasus. Kriging, atau metode berbasis Kriging, memiliki biaya perhitungan yang tinggi (jadi, tidak cepat). Misalnya, TV 4k (atau lebih) modern menggunakan metode interpolasi untuk mencoba dan meningkatkan konten yang dibuat untuk resolusi yang lebih kecil. Ini menyiratkan bahwa perlu melakukan operasi ini dengan cepat dan tanpa intervensi pengguna (yang akan memerlukan model kovarians). Jika saya menyelesaikan masalah khusus ini saya akan menghindari Kriging sama sekali. Selain itu beberapa fenomena berdasarkan pola, atau memiliki variabel diskrit, atau dapat direduksi menjadi rumus (FEM, misalnya), dll ...
armatita
Dan ketika kecepatan tidak penting?
Ben
@ Ben Speed ​​kurang penting jika hasil Anda tidak perlu langsung. Pemodelan bawah permukaan, prediksi cuaca, dan banyak operasi dalam ilmu GIS hanyalah beberapa contoh. Lain adalah yang disajikan dalam jawaban (inversi seismik).
armatita
Maaf, tidak mengerti. Baik komputasi maupun kecepatan hasil tidak masalah, apa kelemahan GP? Atau dengan kata lain: Bukankah seharusnya lebih sering digunakan?
Ben
7

Untuk insinyur itu penting:

  • untuk memiliki interval kepercayaan untuk prediksi
  • untuk menginterpolasi data pelatihan
  • untuk memiliki model yang halus dan nonlinier
  • menggunakan model regresi yang diperoleh untuk desain eksperimen dan optimisasi adaptif

Proses Gaussian memenuhi semua persyaratan ini.

Selain itu, sering set data teknik dan geostatistik tidak terlalu besar atau memiliki struktur grid khusus yang memungkinkan inferensi cepat.

Alexey Zaytsev
sumber
1
Terima kasih atas komentarmu . Tampaknya karena interpretasi bayesian mereka model proses gaussian dapat memiliki kuantifikasi ketidakpastian yang baik, namun ini juga mungkin dalam regresi parametrik. Saya mencari pendekatan teknis yang dapat menjelaskan sekumpulan keunggulan statistik
Wis
3

Keuntungan Model Gaussian.

Gaussian PDF hanya bergantung pada momen urutan pertama dan kedua. Proses Gaussian stasioner yang luas juga merupakan proses stasioner yang ketat dan sebaliknya.

Gaussian PDF dapat memodelkan distribusi banyak proses termasuk beberapa kelas sinyal dan noise yang penting. Jumlah dari banyak proses acak independen memiliki distribusi Gaussian (teorema limit pusat).

Proses non-Gaussian dapat diperkirakan dengan kombinasi tertimbang (yaitu campuran) dari sejumlah pdf Gaussian dengan cara dan varian yang sesuai.

Metode estimasi optimal berdasarkan model Gaussian sering menghasilkan solusi yang linier dan matematis.

Wilson
sumber