Dataset terlampir menunjukkan sekitar 6000 pohon muda di sekitar 50 celah hutan berukuran variabel. Saya tertarik mempelajari bagaimana anakan ini tumbuh di dalam celahnya masing-masing (mis. Bergerombol, acak, tersebar). Seperti yang Anda ketahui, pendekatan tradisional adalah menjalankan Global Moran I. Namun, agregasi pohon dalam agregasi kesenjangan tampaknya merupakan penggunaan yang tidak tepat dari Moran I. Saya menjalankan beberapa statistik uji dengan Moran I menggunakan jarak ambang 50 meter, yang menghasilkan hasil yang tidak masuk akal (yaitu p-value = 0,0000000 ...). Interaksi di antara agregasi gap kemungkinan menghasilkan hasil ini. Saya telah mempertimbangkan membuat skrip untuk loop melalui celah kanopi individu dan menentukan pengelompokan dalam setiap celah, meskipun menampilkan hasil ini kepada publik akan bermasalah.
Apa pendekatan terbaik untuk mengukur pengelompokan dalam kelompok?
sumber
Jawaban:
Anda tidak memiliki bidang acak seragam, jadi mencoba menganalisis semua data Anda sekaligus akan melanggar asumsi statistik apa pun yang Anda pilih untuk dilemparkan pada masalah. Tidak jelas dari pos Anda apakah data Anda merupakan titik proses yang ditandai (yaitu, diameter atau tinggi yang terkait dengan setiap lokasi pohon). Jika data ini tidak mewakili proses titik yang ditandai, saya tidak tahu bagaimana Anda menerapkan Moran's-I. Jika data hanya mewakili lokasi spasial, saya akan merekomendasikan menggunakan Ripley's-K dengan transformasi Besag-L untuk membakukan harapan nol di nol. Hal ini memungkinkan untuk penilaian multiskala pengelompokan. Jika data Anda memiliki nilai terkait, maka opsi terbaik Anda adalah Moran's-I (LISA) setempat. Saya benar-benar akan melihatnya dengan kedua statistik. Apa pun pilihan Anda, Anda masih perlu mengulang-ulang setiap situs untuk menghasilkan hasil yang valid. Berikut adalah beberapa contoh kode R untuk simulasi Monte Carlo dari Ripley's-K / Besag's-L menggunakan dataset sapling redwood bawaan. Seharusnya cukup mudah untuk memodifikasi ini untuk mengulang melalui situs Anda dan menghasilkan grafik untuk masing-masing situs.
sumber
Apa yang Anda miliki adalah pola titik dengan jendela yang merupakan sejumlah kecil wilayah poligon yang terputus.
Anda harus dapat menggunakan salah satu tes
package:spatstat
untuk CSR selama Anda mengisinya dengan jendela yang benar. Ini bisa berupa sejumlah set (x, y) pasangan yang mendefinisikan setiap kliring atau matriks biner dari nilai (0,1) di atas spasi.Pertama mari kita mendefinisikan sesuatu yang sedikit mirip dengan data Anda:
dan mari kita berpura-pura membersihkan kita adalah sel persegi yang kebetulan seperti ini:
Jadi kita bisa memplot fungsi-K dari titik-titik di jendela itu. Kami berharap ini menjadi non-CSR karena poin-poinnya tampak berkerumun di dalam sel. Perhatikan saya harus mengubah kisaran jarak menjadi kecil - dari urutan ukuran sel - jika fungsi-K akan dievaluasi jarak jarak ukuran pola keseluruhan.
Jika kita menghasilkan beberapa titik CSR di sel yang sama, kita dapat membandingkan plot fungsi-K. Yang ini harus lebih seperti CSR:
Anda tidak dapat benar-benar melihat titik-titik yang dikelompokkan dalam sel dalam pola pertama, tetapi jika Anda memplotnya sendiri di jendela grafis itu jelas. Titik-titik dalam pola kedua seragam di dalam sel (dan tidak ada di wilayah hitam) dan fungsi-K jelas berbeda dari
Kpois(r)
, fungsi K CSR untuk data yang dikelompokkan dan serupa untuk data yang seragam.sumber
Selain posting Andy:
Yang ingin Anda hitung adalah ukuran homogenitas spasial (sesuai hipotesis: "Apakah poin Anda terkelompok?") Seperti fungsi L dan K Ripley .
Posting blog ini menjelaskan caranya di R dengan cukup baik. Berdasarkan kode yang dijelaskan, saya pertama-tama akan memberi label pada masing-masing cluster dalam dataset Anda dan kemudian menghitung dalam satu lingkaran untuk setiap cluster amplop kritis melalui Ripley's K
sumber