Apa statistik yang tepat untuk mengukur autokorelasi spasial poin dengan nilai biner?

9

Saya mencoba menentukan tingkat autokorelasi spasial dalam dataset titik. Atribut yang saya minati adalah biner (ada / tidaknya spesies), yang menurut saya Moran tidak sesuai. Di sisi lain, statistik Hitungan Gabungan, yang biasanya direkomendasikan untuk data biner atau kategorikal, tampaknya tidak sesuai untuk data titik. Singkatnya, pertanyaannya adalah: apakah statistik yang tepat untuk mengukur autokorelasi spasial global dan / atau lokal ketika atribut yang diminati adalah biner?

pengguna13706
sumber

Jawaban:

4

Pernyataan Anda bahwa statistik Join-Counts tidak tepat untuk data biner tidak benar. Ini hanya masalah bagaimana matriks bobot spasial (Wij) ditentukan. Seperti dalam Morna's-I, Anda tidak dapat menggunakan matriks jarak dalam jenis analisis ini, Namun, matriks biner kontingensi yang tepat dapat dihitung menggunakan cutoff jarak. Anda dapat membuat jenis matriks bobot spasial ini serta melakukan analisis Join-Count di perpustakaan R spdep. Lihat fungsi "joincount.test" dan joincount.mc (untuk tes permutasi Monte Carlo).

Jeffrey Evans
sumber
Terima kasih, Jeffrey. Hitungan gabungan jelas merupakan cara untuk menggunakan data biner, tetapi saya melihat saran (tidak dapat mengingat di mana, sekarang) bahwa perhitungan gabungan hanya sesuai untuk data area (bukan titik). Bagi saya tidak jelas mengapa Anda tidak bisa membuat matriks bobot menggunakan ambang jarak, dan menggunakan penghitungan bersama, tapi saya tidak bisa menemukan contoh ini di beberapa pencarian sepintas. Apakah ada referensi yang dapat Anda berikan untuk jenis penggunaan ini?
user13706
Ini adalah kumpulan literatur tentang Analisis Pola Titik. Statistik Join-Counts tidak umum digunakan dan, dengan demikian, tidak terlalu lazim dalam literatur saat ini. Saya akan kembali ke pekerjaan awal oleh Diggle atau Geits. Apa tujuan Anda dalam mengukur ketergantungan spasial dalam data binomial? Anda tidak dapat menggunakan koefisien Join-Counts dalam sesuatu seperti efek campuran atau model CAR / SAR. Berikut ini beberapa latar belakang yang menarik tentang penskalaan pola hunian ( en.wikipedia.org/wiki/Scaling_pattern_of_occupancy )
Jeffrey Evans
1
RandomForest adalah model nonparametrik dan, dengan demikian, tidak dipengaruhi oleh autokorelasi. Perhatian dengan model ini adalah korelasi dalam ansambel bootstrap. Seringkali autokorelasi dapat membuat "redundansi" pada data Anda yang menciptakan bias dalam Bootstrap. Saya akan melihat berdasarkan distribusi kondisional dari kovariat Anda. Saya memiliki kode R yang tersedia "R - Plot Probability Density by Grouping Factor" di sini: conserveonline.org/workspaces/emt/documents/all.html
Jeffrey Evans
1
Oh, saya tidak akan menggeneralisasi RF menjadi kotak hitam seluruhnya. Ini sebenarnya bukan masalahnya. Model ini sering disebut sebagai "kotak abu-abu". Karena autokorelasi memengaruhi asumsi IID dalam metode frequentist, maka merupakan pernyataan yang cukup aman bahwa asumsi nonparametrik tidak dilanggar.
Jeffrey Evans
1
Kami menggeneralisasi statistik "nonparametrik". Ini mencakup banyak metode. Jika Anda melihat kembali bukti Brieman's 2001, Anda akan melihat bahwa RF tidak menganggap independensi. Buku Hastie "Elemen Pembelajaran Statistik" memberikan latar belakang statistik yang kuat untuk teori sampel dalam kaitannya dengan metode pembelajaran mesin. Seperti yang dinyatakan sebelumnya, kekhawatiran adalah korelasi dalam ansambel yang tentunya dapat disebabkan oleh pseudoreplication / autocorrelation. Namun, ini bukan model asumsi dalam RF. Namun, jika cukup parah, efek bersih bias atau overfit jelas sama.
Jeffrey Evans
0

Data biner adalah kasus penggunaan normal untuk autokorelasi spasial. Saya pikir sebagian besar buku analisis spasial akan membicarakannya. Dokumen ini mungkin bisa membantu.

mfdev
sumber
1
Halaman pertama referensi Anda menekankan bahwa "lokasi data adalah wilayah ," sehingga sepertinya tidak berlaku untuk data titik sama sekali.
Whuber