Saya mendapatkan beberapa data dengan jumlah spesimen dengan permintaan untuk menginterpolasinya menggunakan metode kriging.
Setelah beberapa penyelidikan tampak bahwa hasil kriging (dilakukan di ArcGIS Geostatistic Analyst dengan parameter default) tidak memuaskan. Nilai interpolasi jauh berbeda dari pengukuran (terutama yang atas) dan permukaannya tidak terlihat andal. Inilah gambarnya:
Saya kira masalah utamanya adalah jumlah sampel yang tidak mencukupi.
Berapa banyak poin yang harus kita gunakan untuk mendapatkan hasil yang dapat diandalkan?
Atau mungkin metode kriging tidak sesuai untuk nilai yang beragam seperti itu?
Jawaban:
Ketika Anda menggunakan "nilai default" Anda tidak benar-benar kriging, Anda hanya menerapkan algoritma kriging - yang seperti yang Anda temukan, buruk ketika digunakan dengan data ini.
(Saya akan naik ke kotak sabun untuk kata-kata kasar singkat: menurut saya, cara tercepat untuk mendapatkan hasil yang buruk dengan program komputer adalah menerima parameter standarnya. ArcGIS adalah salah satu lingkungan terkaya, paling kuat untuk mendapatkan hasil yang buruk ini cara. Moralnya adalah jangan menggunakan perangkat lunak untuk pekerjaan penting sampai Anda mengerti bagaimana mengendalikannya. Turun dari kotak sabun sekarang ...)
Agar kriging bekerja, Anda harus melakukan analisis statistik awal yang intensif atas data yang dikenal sebagai "variografi." Seberapa baik kinerja ini pada akhirnya tergantung pada data serta keterampilan geostatistik Anda. (Seluruh buku telah ditulis tentang variografi, termasuk Geostatistik Pertambangan seminal oleh Journel & Huijbregts dan Variowin oleh Yvan Pannatier.) Meskipun orang telah berhasil membajak data poin sebanyak tujuh (dalam monograf oleh Robert Jernigan yang diterbitkan oleh US EPA di AS). akhir tahun 1980-an), dan pada prinsipnya Anda dapat menggunakan hanya dua atau tiga poin (saya telah melakukan ini untuk mendemonstrasikan algoritma ), aturan praktis dalam literatur berkisar dari minimal 20 poin hingga 100 poin dan konsensus tampaknya sekitar 30 poin.
Dalam kasus Anda - meskipun Anda tidak mendeskripsikan data - Anda memiliki beberapa masalah yang jelas, termasuk distribusi yang sangat miring dan tidak adanya bukti stasioneritas. Ini memerlukan perlakuan statistik khusus atau bentuk khusus kriging (seperti model linear umum spasial). Anda tidak akan mendapatkan hasil yang baik saat mengumpulkan data tersebut hingga Anda memiliki jumlah data yang sangat besar.
Legenda menunjukkan Anda mungkin mencoba untuk membuat grid kepadatan daripada benar-benar menginterpolasi data: meskipun output dari kedua prosedur mungkin terlihat sama, mereka melakukan hal yang berbeda dan memiliki interpretasi yang berbeda. Anda menginterpolasi ketika data dianggap sampel dari beberapa permukaan kontinyu hipotetis. Interpolasi memprediksi nilai yang tidak dicampuri. Contoh standar termasuk pengukuran ketinggian (yang sampel permukaan bumi) dan pengukuran suhu (yang sampel "bidang suhu"). Anda menghitung kepadatan ketika Anda memiliki informasi lengkap tentang jumlahnyasesuatu dan Anda ingin mewakili versi yang dihaluskan dari jumlah itu per satuan luas. (Berbeda dengan interpolasi, tidak ada nilai yang tidak dicampuri untuk diprediksi.) Contoh standar adalah kepadatan populasi: data adalah jumlah semua individu dalam suatu wilayah; outputnya adalah peta kepadatan penduduk.
sumber
Ada dua pertanyaan terpisah, pertama jumlah lokasi data yang digunakan dalam memperkirakan / memodelkan variogram dan kedua jumlah lokasi data yang akan digunakan dalam persamaan kriging untuk menginterpolasi nilai pada lokasi non-data (atau untuk memperkirakan nilai rata-rata). lebih dari satu wilayah). Dengan asumsi Anda menggunakan lingkungan pencarian yang bergerak, lebih dari 15-20 lokasi data di lingkungan tersebut kemungkinan akan menurunkan hasil karena (1) hanya lokasi data terdekat di lingkungan pencarian yang memiliki bobot bukan nol, (2) dengan lebih banyak data lokasi ukuran matriks yang akan dibalik lebih besar dan kemungkinan peningkatan matriks yang tidak terkondisi. Jumlah total lokasi data yang diperlukan untuk kriging tergantung pada jumlah lokasi yang akan diinterpolasi dan pola spasial dari titik-titik tersebut dan juga dari lokasi data. Pendeknya,
Sehubungan dengan memperkirakan / memodelkan variogram itu adalah masalah yang sangat berbeda, lihat misalnya
1991, Myers, DE, Tentang Estimasi Estogram dalam Prosiding Inter Pertama. Conf. Stat. Comp., Cesme, Turki,
30 Mar. - 2 April 1987, Vol II, American Sciences Press, 261-281
1987, A. Warrick dan DE Myers, Optimalisasi Lokasi Sampel untuk Perhitungan Variogram Penelitian Sumber Daya Air 23, 496-500
Ini dapat diunduh di www.u.arizona.edu/~donaldm
sumber