Bagaimana cara membuat peta kesalahan untuk mendukung peta kerapatan kernel rata-rata?

10

Saya telah membuat peta kerapatan kernel rata-rata dengan menjalankan KDE pada titik-titik yang ditumpuk dalam tingkat spasial yang sama. Misalnya, kita memiliki tiga titik shapefile yang mewakili bibit di tiga celah hutan berbeda dengan bentuk dan ukuran yang sama. Saya menjalankan KDE untuk setiap titik shapefile. Output dari KDE yang kemudian ditumpuk berdasarkan batas spasial untuk menghitung rata-rata di Arc raster kalkulator, misalnya: Float(("KDE1"+"KDE2"+"KDE3")/3). Inilah produk akhirnya:

masukkan deskripsi gambar di sini

Sekarang saya tertarik untuk membuat peta yang menggambarkan kesalahan yang terkait dengan KDE rata-rata. Saya berharap untuk menggunakan peta kesalahan untuk menggambarkan secara visual berapa banyak kesalahan yang terkait dengan hotspot (misalnya, apakah hotspot SW sepenuhnya disebabkan oleh titik-titik dalam satu celah?). Bagaimana cara saya membuat peta kesalahan yang terkait dengan KDE rata-rata? Apakah MSE akan menjadi ukuran kesalahan yang paling tepat dalam kasus ini?

Harun
sumber
3
Ini analisis yang sangat menarik. Apa yang Anda maksud dengan "kesalahan standar"? Beberapa jenis penyimpangan (perbedaan) masing-masing peta kerapatan dari lapisan "rata-rata"?
Analisis Lansekap
@Landscape Analysis Post diedit untuk mengomentari komentar. Ya, saya berpikir bahwa perkiraan MSE mungkin paling tepat dalam kasus ini. Intinya, menunjukkan bagaimana setiap KDE berbeda dari rata-rata KDE. Saya tidak yakin bagaimana menggabungkan semua ini menggunakan ArcGIS dan / atau skrip.
Aaron

Jawaban:

8

Sebuah Peringatan

Kesalahan standar adalah cara yang berguna untuk memperkirakan ketidakpastian dari data sampel ketika tidak ada kesalahan sistematis dalam data. Asumsi tersebut memiliki validitas yang meragukan dalam konteks ini, karena (a) peta KDE akan secara lokal memiliki kesalahan pasti yang dapat bertahan secara sistematis di antara lapisan-lapisan dan (b) komponen ketidakpastian yang berpotensi besar karena pilihan jari-jari kernel (atau "bandwidth) ") tidak akan tercermin sama sekali di salah satu koleksi peta ini.

Beberapa Pilihan

Namun demikian, menggambarkan variabilitas di antara kumpulan peta yang terkait, dilokasikan ("ditumpuk") adalah ide bagus - asalkan Anda ingat keterbatasan yang baru saja dijelaskan. Beberapa ukuran variabilitas lokal akan alami dalam pengaturan ini, termasuk:

  • The berbagai nilai-nilai, dinyatakan baik additively (maksimum dikurangi minimum) atau multiplicatively (maksimum dibagi dengan minimum).

  • The varians atau standar deviasi dari nilai-nilai. Versi multiplikatif ini akan menjadi varian atau standar deviasi dari logaritma nilai.

  • Penaksir dispersi yang kuat, seperti kisaran interkuartil (atau rasio kuartil ketiga dan pertama).

Dalam banyak hal, langkah-langkah multiplikasi mungkin lebih sesuai untuk kepadatan, karena perbedaan antara (katakanlah) 100 dan 101 pohon per acre mungkin tidak penting sedangkan perbedaan antara 2 dan 1 pohon per acre bisa relatif penting. Keduanya menunjukkan kisaran yang sama (aditif) dari 101 - 100 = 2 - 1 = 1, tetapi rentang multiplikatif mereka dari 1,01 dan 2,00 berbeda secara substansial. (Perhatikan bahwa rentang multiplikasi selalu melebihi 1, sehingga 2,00 seratus kali lebih jauh dari 1 daripada 1,01.)

Komputasi

Menghitung langkah-langkah ini membutuhkan beberapa bentuk statistik lokal. The statistik sel fungsi dalam Spatial Analyst akan menghitung varians, rentang, dan standar deviasi. Kuantil lokal dapat ditemukan dengan pangkat . Daripada bersikap rewel tentang peringkat mana yang akan digunakan, pilih yang nyaman di dekat kuartil. Untuk menemukannya, misalkan n adalah jumlah kisi di tumpukan. Median memiliki peringkat (n + 1) / 2 - yang mungkin bukan bilangan bulat, yang mengindikasikan bahwa itu harus dihitung dengan rata-rata peringkat n / 2 dan n / 2 + 1, yang keduanya akan mendekati median. Untuk memperkirakan kuartil, maka, bulatkan (n + 1) / 2 ke bilangan bulat terdekat, lalu tambahkan lagi 1 dan bagi dengan 2. Biarkan angka ini menjadi r . Menggunakanr dan n +1 - r untuk jajaran kuartil.

Sebagai contoh, jika tumpukan memiliki n = 6 kisi, (n + 1) / 2 dibulatkan adalah 3 dan (3 + 1) / 2 = 2 tidak perlu dibulatkan. Gunakan r = 2 dan r = 6 + 1 - 2 = 5 untuk peringkat. Akibatnya, prosedur ini akan mengembalikan nilai terendah kedua ( r = 2) dan tertinggi kedua ( r = 5) dari enam nilai di setiap sel. Anda dapat memetakan perbedaan atau rasio mereka.

whuber
sumber
2
Saya akan membayangkan bahwa koefisien variasi akan berguna dalam konteks ini.
Jeffrey Evans
1
@jeffrey Terima kasih, itu juga pertimbangan. CV diperoleh dengan membagi grid deviasi standar (lokal) dengan grid mean (lokal). Saya tidak menyebutkannya, tetapi untuk rangkuman multiplikasi seperti itu, beberapa kehati-hatian harus diambil untuk menutupi area-area di mana penyebutnya (rata-rata atau minimum, tergantung kasusnya) mendekati nol: hasilnya mungkin tidak dapat diandalkan di sana dan kemungkinan akan mencerminkan tidak lain dari ketidaktepatan numerik dan ketidakakuratan kecil dalam mendekati kernel.
whuber
@whuber, bisakah Anda menjelaskan (a) di paragraf pertama Anda? Sebagai contoh, apakah Anda mengacu pada kesalahan dalam teknik pengumpulan data yang mungkin bertahan di setiap celah hutan (dan karenanya secara sistematis memanifestasikan diri dalam setiap raster KDE), atau kesalahan terkait dengan implementasi fungsi fokus?
MannyG
@whuber Ide bagus di sekitar - terima kasih banyak!
Aaron