Mengapa Anda harus memberikan model variogram saat Anda melakukan kriging?

9

Saya sangat baru dalam statistik spasial dan menonton banyak tutorial,

Tapi saya tidak benar-benar mengerti mengapa Anda harus memberikan model variogram ketika Anda krige.

Saya menggunakan paket gstat di R, dan ini adalah contoh yang mereka berikan:

library(sp)
data(meuse)
coordinates(meuse) = ~x+y
data(meuse.grid)
str(meuse.grid)
gridded(meuse.grid) = ~x+y
m <- vgm(.59, "Sph", 874, .04)
print(m)
# ordinary kriging:
x <- krige(log(zinc)~1, meuse, meuse.grid, model = m)

Apakah ada yang bisa menjelaskan dalam beberapa baris mengapa Anda pertama kali harus memasok vgm? Dan bagaimana Anda mengatur parameter?

Terima kasih sebelumnya! Kasper

Kasper
sumber
Untuk kriging sederhana , estimator adalah BIRU hanya jika kovarians rata-rata dan spasial diketahui sebelumnya. Dalam kriging biasa seseorang memperkirakan variogram dari data dan kemudian melakukan interpolasi. Lihat sketsa dari gstatpaket R dari data meuse yang sama.
Andy W
Hei Andy, terima kasih atas komentar Anda. Saya menemukan dalam sketsa bahwa Anda juga dapat melakukan krige tanpa model variogram. Saya melakukan yang berikut: krige (residual ~ 1, temp_plot_spatial, y, nmin = 5, nmax = 10), jadi krige dengan hanya melihat minimum 5 tetangga dan maksimum 10. Apakah ini masuk akal sama sekali? Hasilnya lumayan
Kasper
Saya pikir saya punya masalah dengan pemodelan variogram: bagaimana jika Anda menganggap korelasi tidak ada hubungannya dengan jarak tetapi dengan tetangga terdekat?
Kasper
"Bagaimana jika kamu menganggap korelasinya tidak ada hubungannya dengan jarak kecuali dengan tetangga terdekat?" - Itu bukan kriging, lebih sesuai dengan klasifikasi knn Kode ini krige(residuals~1 ,temp_plot_spatial, y, nmin=5, nmax=10)memperkirakan variogram lokal. Misalnya Anda tidak memiliki variogram di seluruh ruang belajar, tetapi perkirakan model baru untuk setiap lokasi yang Anda coba prediksi. Model lokal kemudian hanya meraih 10 nilai terdekat (karena Anda tidak menentukan jarak maks, itu harus selalu ambil 10 nilai, jadi nminharus berlebihan).
Andy W
1
Maka memperkirakan variogram lokal adalah hal yang logis untuk dilakukan. Jika mereka bervariasi sesuai dengan fitur tertentu termasuk prediktor lain dalam model juga merupakan pilihan. IDW mungkin dianggap sebagai tipe paling sederhana dari model kriging - jadi IDW seharusnya tidak lebih baik daripada benar-benar memperkirakan variogram dari data.
Andy W

Jawaban:

9

Pendahuluan dan Ringkasan

Hukum Geografi Tobler menegaskan

Segala sesuatu terkait dengan segala sesuatu yang lain, tetapi hal-hal yang dekat lebih terkait daripada hal-hal yang jauh.

Kriging mengadopsi model hubungan tersebut di mana

  • "Benda" adalah nilai numerik di lokasi di permukaan bumi (atau di luar angkasa), biasanya direpresentasikan sebagai bidang Euclidean.

  • Nilai-nilai numerik ini dianggap realisasi dari variabel acak.

  • "Terkait" diekspresikan dalam bentuk sarana dan kovarian dari variabel acak ini.

(Kumpulan variabel acak yang terkait dengan titik-titik di ruang angkasa disebut "proses stokastik.") Variogram menyediakan informasi yang diperlukan untuk menghitung kovarian tersebut.

Apa itu Kriging

Kriging secara khusus adalah prediksi hal-hal di tempat-tempat di mana mereka belum diamati. Untuk membuat proses prediksi traktat secara matematis, Kriging membatasi formula yang mungkin menjadi fungsi linier dari nilai yang diamati. Itu membuat masalah menjadi terbatas untuk menentukan koefisien apa yang seharusnya. Ini dapat ditemukan dengan mensyaratkan bahwa prosedur prediksi memiliki sifat-sifat tertentu. Secara intuitif, properti yang sangat baik adalah bahwa perbedaan antara prediktor dan nilai sebenarnya (tetapi tidak diketahui) cenderung cenderung kecil: yaitu, prediktor harus tepat . Properti lain yang sangat dipuji tetapi lebih dipertanyakan adalah bahwa rata-rata prediktor harus sama dengan nilai sebenarnya: itu harus akurat .

(Alasan yang menekankan akurasi sempurna dipertanyakan - tetapi tidak selalu buruk - adalah bahwa hal itu biasanya membuat prosedur statistik menjadi kurang tepat: yaitu, lebih bervariasi. Ketika memotret pada target, Anda lebih suka menyebarkan hit secara merata di sekitar pelek dan jarang mengenai pusat atau Anda akan menerima hasil yang difokuskan tepat di sebelah, tetapi tidak tepat pada, pusat? Yang pertama akurat tetapi tidak tepat sedangkan yang terakhir tidak akurat tetapi tepat.)

Asumsi dan kriteria ini - yang berarti dan kovarian adalah cara yang tepat untuk mengukur keterkaitan, bahwa prediksi linier akan berfungsi, dan bahwa prediktor harus setepat mungkin dengan subjek yang sepenuhnya akurat - mengarah ke sistem persamaan yang memiliki solusi unik asalkan kovariansi telah ditentukan secara konsisten . Prediktor yang dihasilkan dengan demikian disebut "BLUP": Best Linear Un Match Predictor.

Di mana Variogram Datang

Menemukan persamaan ini memerlukan operasionalisasi program yang baru saja dijelaskan. Ini dilakukan dengan menuliskan kovariansi antara prediktor dan pengamatan yang dianggap sebagai variabel acak. The aljabar dari covariances menyebabkan covariances antara nilai-nilai yang diamati untuk masuk ke dalam persamaan kriging, juga.

Pada titik ini kita mencapai jalan buntu, karena kovarian hampir selalu tidak diketahui. Setelah semua, dalam sebagian besar aplikasi kami telah mengamati hanya satu realisasi dari masing-masing variabel acak: yaitu, dataset kami, yang merupakan hanya satu angka di setiap lokasi yang berbeda. Masukkan variogram: fungsi matematika ini memberi tahu kita apa kovarians antara dua nilai yang seharusnya. Terkendala untuk memastikan bahwa kovarian ini "konsisten" (dalam arti bahwa kovarian tidak akan memberikan seperangkat kovarian yang mustahil secara matematis: tidak semua koleksi ukuran numerik "keterkaitan" akan membentuk matriks kovarian aktual ). Itulah sebabnya variogram sangat penting untuk Kriging.

Referensi

Karena pertanyaan langsung telah dijawab, saya akan berhenti di sini. Pembaca yang tertarik dapat mempelajari bagaimana variogram diestimasi dan diinterpretasikan dengan berkonsultasi dengan teks-teks yang bagus seperti Journel & Huijbregts ' Mining Geostatistics (1978) atau Ishak & Srivastava's Applied Geostatistics (1989). (Perhatikan bahwa proses estimasi memperkenalkan dua objek yang disebut "variogram": variogram empiris yang berasal dari data dan variogram model yang dipasang padanya. Semua referensi "variogram" dalam jawaban ini adalah untuk model. Panggilan ke vgmdalam pertanyaan mengembalikan representasi komputer dari variogram model.) Untuk pendekatan yang lebih modern di mana estimasi variogram dan Kriging dikombinasikan secara tepat, lihat Diggle &Model-based Geostatistics (2007) (yang juga merupakan manual yang diperluas untuk Rpaket - paket GeoRdan GeoRglm).


Komentar

Secara kebetulan, apakah Anda menggunakan Kriging untuk prediksi atau algoritma lainnya, karakterisasi kuantitatif keterkaitan yang diberikan oleh variogram berguna untuk menilai setiap prosedur prediksi. Perhatikan bahwa semua metode interpolasi spasial adalah prediktor dari sudut pandang ini - dan banyak dari mereka adalah prediktor linier, seperti IDW (Inverse Distance Weighted). Variogram dapat digunakan untuk menilai nilai rata-rata dan dispersi (standar deviasi) dari salah satu metode interpolasi. Dengan demikian memiliki penerapan jauh melampaui penggunaannya di Kriging.

whuber
sumber
Terima kasih atas jawaban terinci ini. Saya mengajukan pertanyaan yang sama seperti di atas, bagaimana jika saya tidak dapat membuat asumsi bahwa korelasi spasial tidak tergantung pada lokasi? Benarkah memodelkan variogram itu kemudian tidak berguna, karena saya harus membuat model variogram untuk semua lokasi? Apakah lebih baik menggunakan IDW?
Kasper
Ketika Anda tidak dapat mengasumsikan stasioneritas urutan kedua dari proses, maka beberapa opsi termasuk (1) mengumpulkan beberapa realisasi proses (ketika bervariasi dengan waktu); (2) mengestimasi variograms di atas subregional lokal (ketika ada banyak data); dan (3) mengasumsikan model parametrik untuk bagaimana variogram berubah dengan lokasi (seperti dalam model GARCH untuk proses 1D). Komentar terakhir saya secara langsung membahas ketidaksenangan untuk kembali pada sesuatu seperti IDW: apakah Anda dapat memperkirakan variogram, pada prinsipnya ada dan karena itu IDW biasanya suboptimal.
whuber