Saya mencari rekomendasi tentang praktik terbaik untuk menangani lapisan data raster dengan resolusi dan proyeksi yang berbeda. Saran yang saya berikan adalah untuk selalu melakukan resample ke layer dengan resolusi terendah sebelum melakukan analisis apa pun, tetapi ini sepertinya membuang-buang presisi bagi saya dan saya tidak pernah diberi penjelasan yang solid mengapa itu harus dilakukan.
Kapan masuk akal untuk mencocokkan ulang agar sesuai dengan kisi resolusi yang lebih tinggi dan apa implikasinya dibandingkan dengan mengamplas ke resolusi yang lebih rendah?
Saya menyadari bahwa ini sangat tergantung pada situasi. Saya kebanyakan mencari pedoman umum, tapi inilah skenario khusus saya untuk referensi:
Skenario: Saya sedang mencari untuk membangun model regresi spasial yang memprediksi penggunaan lahan berdasarkan berbagai lapisan lingkungan dan sosial ekonomi. Peta penggunaan lahan saya berasal dari Landsat dan karenanya memiliki resolusi 30m. Contoh lapisan penjelas termasuk DEM SRTM (3 arc-detik, ~ 90m) dan lapisan iklim Bioclim (30 arc-detik, ~ 1km).
sumber
Jawaban:
Sebenarnya ini tidak semua tergantung pada situasi dan semua tentang kesalahan statistik.
Setiap kali Anda melakukan resample ke resolusi yang lebih tinggi, Anda memperkenalkan akurasi yang salah. Pertimbangkan satu set data yang diukur dalam kaki hanya pada bilangan bulat. Setiap titik yang diberikan mungkin +/- 0,5 kaki dari lokasi sebenarnya. Jika Anda menguji ulang ke persepuluh terdekat, Anda sekarang mengatakan bahwa angka yang diberikan tidak lebih dari +/- 0,1 dari lokasi sebenarnya. Namun Anda tahu pengukuran asli Anda tidak seakurat itu, dan Anda sekarang beroperasi dalam margin of error. Namun jika Anda memilih sebaliknya dan melakukan resample ke resolusi yang lebih rendah, Anda tahu bahwa nilai poin yang diberikan pasti akurat karena terkandung dalam margin of error sampel yang lebih besar.
Di luar matematika statistik, tempat pertama yang muncul dalam pikiran adalah dalam survei tanah. Survei yang lebih lama hanya menentukan bantalan ke setengah menit terdekat dan jarak ke sepersepuluh kaki. Memplot garis batas dengan pengukuran-pengukuran ini seringkali dapat menghasilkan kesalahan tutupan (titik awal dan titik akhir harus sama tetapi tidak) diukur dengan kaki. Survei modern pergi ke setidaknya satu detik terdekat dan satu kaki. Nilai yang diturunkan (seperti area banyak) dapat secara signifikan dipengaruhi oleh perbedaan dalam presisi. Nilai yang diturunkan itu sendiri juga dapat diberikan sebagai terlalu tepat.
Dalam kasus analisis Anda, jika Anda melakukan resample ke resolusi yang lebih tinggi, hasil Anda akan menyiratkan akurasi yang jauh lebih besar daripada data yang menjadi dasarnya. Pertimbangkan SRTM Anda pada jarak 90m. Dengan metode apa pun mereka mengukur ketinggian (rata-rata / pengembalian rata-rata), unit terkecil (piksel) yang dapat dibedakan dari tetangganya adalah 90m. Jika Anda membuat ulang itu menjadi 30m, baik:
Dengan demikian dalam kedua kasus Anda memperkenalkan akurasi palsu karena subsampel baru Anda tidak benar-benar diukur.
Pertanyaan terkait: Praktik apa yang tersedia untuk memodelkan kesesuaian lahan?
sumber