Jumlah minimum sampel untuk interpolasi kriging

19

Saya mendapatkan beberapa data dengan jumlah spesimen dengan permintaan untuk menginterpolasinya menggunakan metode kriging.
Setelah beberapa penyelidikan tampak bahwa hasil kriging (dilakukan di ArcGIS Geostatistic Analyst dengan parameter default) tidak memuaskan. Nilai interpolasi jauh berbeda dari pengukuran (terutama yang atas) dan permukaannya tidak terlihat andal. Inilah gambarnya: masukkan deskripsi gambar di sini
Saya kira masalah utamanya adalah jumlah sampel yang tidak mencukupi.

Berapa banyak poin yang harus kita gunakan untuk mendapatkan hasil yang dapat diandalkan?
Atau mungkin metode kriging tidak sesuai untuk nilai yang beragam seperti itu?

Marcin
sumber
Anda mengatakan bahwa "Meskipun orang telah berhasil mengumpulkan data sebanyak tujuh poin (dalam sebuah monograf oleh Robert Jernigan yang diterbitkan oleh US EPA pada akhir 1980-an), ...". Tetapi saya tidak dapat menemukan artikel ini. Bisakah Anda memberikan alamat terbuka untuk artikel ini? Terima kasih ...
abilici

Jawaban:

30

Ketika Anda menggunakan "nilai default" Anda tidak benar-benar kriging, Anda hanya menerapkan algoritma kriging - yang seperti yang Anda temukan, buruk ketika digunakan dengan data ini.

(Saya akan naik ke kotak sabun untuk kata-kata kasar singkat: menurut saya, cara tercepat untuk mendapatkan hasil yang buruk dengan program komputer adalah menerima parameter standarnya. ArcGIS adalah salah satu lingkungan terkaya, paling kuat untuk mendapatkan hasil yang buruk ini cara. Moralnya adalah jangan menggunakan perangkat lunak untuk pekerjaan penting sampai Anda mengerti bagaimana mengendalikannya. Turun dari kotak sabun sekarang ...)

Agar kriging bekerja, Anda harus melakukan analisis statistik awal yang intensif atas data yang dikenal sebagai "variografi." Seberapa baik kinerja ini pada akhirnya tergantung pada data serta keterampilan geostatistik Anda. (Seluruh buku telah ditulis tentang variografi, termasuk Geostatistik Pertambangan seminal oleh Journel & Huijbregts dan Variowin oleh Yvan Pannatier.) Meskipun orang telah berhasil membajak data poin sebanyak tujuh (dalam monograf oleh Robert Jernigan yang diterbitkan oleh US EPA di AS). akhir tahun 1980-an), dan pada prinsipnya Anda dapat menggunakan hanya dua atau tiga poin (saya telah melakukan ini untuk mendemonstrasikan algoritma ), aturan praktis dalam literatur berkisar dari minimal 20 poin hingga 100 poin dan konsensus tampaknya sekitar 30 poin.

Dalam kasus Anda - meskipun Anda tidak mendeskripsikan data - Anda memiliki beberapa masalah yang jelas, termasuk distribusi yang sangat miring dan tidak adanya bukti stasioneritas. Ini memerlukan perlakuan statistik khusus atau bentuk khusus kriging (seperti model linear umum spasial). Anda tidak akan mendapatkan hasil yang baik saat mengumpulkan data tersebut hingga Anda memiliki jumlah data yang sangat besar.

Legenda menunjukkan Anda mungkin mencoba untuk membuat grid kepadatan daripada benar-benar menginterpolasi data: meskipun output dari kedua prosedur mungkin terlihat sama, mereka melakukan hal yang berbeda dan memiliki interpretasi yang berbeda. Anda menginterpolasi ketika data dianggap sampel dari beberapa permukaan kontinyu hipotetis. Interpolasi memprediksi nilai yang tidak dicampuri. Contoh standar termasuk pengukuran ketinggian (yang sampel permukaan bumi) dan pengukuran suhu (yang sampel "bidang suhu"). Anda menghitung kepadatan ketika Anda memiliki informasi lengkap tentang jumlahnyasesuatu dan Anda ingin mewakili versi yang dihaluskan dari jumlah itu per satuan luas. (Berbeda dengan interpolasi, tidak ada nilai yang tidak dicampuri untuk diprediksi.) Contoh standar adalah kepadatan populasi: data adalah jumlah semua individu dalam suatu wilayah; outputnya adalah peta kepadatan penduduk.

whuber
sumber
6
Jawaban bagus @whuber. Namun, bukankah jumlah minimum poin juga sebagian tergantung pada luasnya domain spasial dan butir prediksi yang diinginkan? Jika Anda menyaringnya menjadi masalah pengambilan sampel maka itu menjadi pertanyaan tentang menangkap populasi dan variasi spasial dalam sampel.
Jeffrey Evans
@ Jeffrey Itu sebagian kasusnya. Jumlah data dikenakan pada dua hal: varians prediksi kriging (yang bervariasi di seluruh domain spasial) dan akurasi dengan mana variogram itu sendiri dapat diperkirakan. Yang terakhir ini sering diabaikan, terutama dalam perawatan tradisional kriging: itu semacam gajah di dalam ruangan. Jika Anda mengetahui variogram yang benar dan memiliki rasio nugget / ambang kecil dan rentang besar relatif terhadap luasnya domain spasial, Anda dapat bekerja dengan sedikit data, terutama jika mereka mencukupi sampel nilai data kisaran penuh.
whuber
3
Saya yakin bahwa siapa pun yang menggunakan kriging harus memerlukan kursus geostatistik yang baik atau memiliki latar belakang GIS / statistik yang solid. Miring bagaimana memodelkan semivariogram dengan benar membutuhkan keterampilan.
Mike T
1
Aturan praktis yang telah saya tekankan: 30 poin untuk omnidirectional Kriging dan 100 untuk bidirectional.
jareks
1

Ada dua pertanyaan terpisah, pertama jumlah lokasi data yang digunakan dalam memperkirakan / memodelkan variogram dan kedua jumlah lokasi data yang akan digunakan dalam persamaan kriging untuk menginterpolasi nilai pada lokasi non-data (atau untuk memperkirakan nilai rata-rata). lebih dari satu wilayah). Dengan asumsi Anda menggunakan lingkungan pencarian yang bergerak, lebih dari 15-20 lokasi data di lingkungan tersebut kemungkinan akan menurunkan hasil karena (1) hanya lokasi data terdekat di lingkungan pencarian yang memiliki bobot bukan nol, (2) dengan lebih banyak data lokasi ukuran matriks yang akan dibalik lebih besar dan kemungkinan peningkatan matriks yang tidak terkondisi. Jumlah total lokasi data yang diperlukan untuk kriging tergantung pada jumlah lokasi yang akan diinterpolasi dan pola spasial dari titik-titik tersebut dan juga dari lokasi data. Pendeknya,

Sehubungan dengan memperkirakan / memodelkan variogram itu adalah masalah yang sangat berbeda, lihat misalnya

1991, Myers, DE, Tentang Estimasi Estogram dalam Prosiding Inter Pertama. Conf. Stat. Comp., Cesme, Turki,

30 Mar. - 2 April 1987, Vol II, American Sciences Press, 261-281

1987, A. Warrick dan DE Myers, Optimalisasi Lokasi Sampel untuk Perhitungan Variogram Penelitian Sumber Daya Air 23, 496-500

Ini dapat diunduh di www.u.arizona.edu/~donaldm

Donald Myers
sumber