Saya minta maaf sebelumnya jika pertanyaan ini diajukan dengan buruk: Saya seorang astronom, bukan ahli statistik. Pertanyaan saya secara khusus bertujuan untuk membantu saya mencari tahu apakah proses Gaussian adalah teknik yang tepat untuk masalah saya.
Menggunakan teleskop dan spektrograf pengumpanan serat, proyek saya telah mengambil spektrum optik galaksi di banyak lokasi. Pola pengambilan sampel untuk satu titik menunjuk pada gambar pertama, dan diulang total tiga kali, dengan offset spasial yang berbeda, untuk mengisi kekosongan (gambar kedua). Idealnya, saya ingin membuat perkiraan jumlah tertentu di atas kisi yang menutupi galaksi.
Metode naif saya adalah menganalisis setiap spektrum serat secara terpisah, sehingga saya memiliki titik-perkiraan jumlah bunga, dan kemudian membangun proses Gaussian untuk memperkirakan jumlah tersebut di mana-mana. Demikian pula, saya bisa membuat proses Gaussian untuk spektra itu sendiri, kemudian menganalisis GP pada grid pilihan saya untuk menemukan jumlah yang saya minati. Namun, saya tidak yakin ini bahkan merupakan pendekatan yang valid, karena pengamatan saya adalah bukan diskrit, melainkan bertepatan.
Tidak seperti, misalnya, ilmuwan tanah, yang mungkin mengambil sampel tanah dari lokasi yang sangat berbeda, dan kemudian bergerak 50 meter & mengulangi, pengamatan saya tumpang tindih secara spasial, jadi saya mengintegrasikan semua cahaya yang diberikan oleh galaksi. Tidak jelas bagi saya bahwa saya akan diizinkan untuk mengabaikan variasi spasial yang mungkin ada dalam pengukuran tertentu. Dengan kata lain, apakah proses Gaussian bahkan valid ketika lokasi pengambilan sampel individu tidak kecil? Dapatkah saya membangun istilah spasial tambahan untuk menjelaskan "pencampuran" cahaya dalam satu serat?
Tambahan: Secara tradisional, spektra hanya diinterpolasi, diamplas pada grid, dan kemudian dianalisis, yang juga menurut saya sangat salah - tetapi jika saya akan menghujani parade kolega, setidaknya saya ingin menyajikan metode alternatif.
sumber
Ada topik dalam geostatistik yang disebut Exact Downscaling. Tujuan utama di sini adalah untuk memperkirakan properti pada skala yang lebih kecil dari pengamatan. Juga pengamatan ini mungkin tumpang tindih atau tidak (tidak terlalu penting). Silakan lihat makalah ini: http://www.ccgalberta.com/ccgresources/report07/2005-101-exact_reproduction.pdf
Dalam tulisan ini, mereka menunjukkan metode untuk menurunkan skala pengamatan menggunakan teknik geostatistik. Mereka menunjukkan bahwa dengan menghitung kovariansi lintas dengan benar antara skala data yang berbeda (titik vs blok) estimasi kriging masih valid; sedemikian rupa sehingga rata-rata nilai estimasi pada skala yang lebih kecil sama dengan data input yang lebih besar. Pada dasarnya, untuk menghitung nilai estimasi dalam skala apa pun, Anda hanya perlu menghitung fungsi kovarians antara data input, skala target, dan korelasi silang dengan benar. Pada Proses Gaussian, asumsinya adalah bahwa estimasi sedang dilakukan pada skala yang sama dengan pengamatan input.
Jadi ini adalah langkah-langkahnya: 1- Hitung variogram eksperimental dari data Anda.
2- Pasangkan model variogram dengan variogam pengalaman Anda. Anda mungkin perlu menjelaskan anisotropi terarah di sini. Ini adalah fungsi kovarians yang dalam GP dihitung dengan metode kemungkinan maksimum.
3- Hitung semua kovariansi dan kovariansi silang antara data input dan skala target. Ada tanda terima numerik untuk langkah ini. Idenya adalah bahwa dengan mendiskritisasi blok menjadi poin yang terbatas, Anda dapat menghitung kovarians rata-rata. Data yang tumpang tindih harus diperhitungkan di sini.
4- melakukan Kriging dan menghitung nilai estimasi.
GP adalah topik yang sangat terkait dengan geostatistik. Namun, geostatistik tidak terbatas pada proses Gaussian. Ada banyak metode lain untuk memperkirakan atau mensimulasikan proses acak.
sumber