Moran's I , ukuran autokorelasi spasial, bukan statistik yang sangat kuat (bisa sensitif terhadap distribusi atribut data spasial yang miring).
Apa sajakah teknik yang lebih kuat untuk mengukur autokorelasi spasial? Saya sangat tertarik dengan solusi yang sudah tersedia / dapat diterapkan dalam bahasa scripting seperti R. Jika solusi berlaku untuk keadaan / distribusi data yang unik, harap sebutkan yang ada di jawaban Anda.
EDIT : Saya memperluas pertanyaan dengan beberapa contoh (sebagai tanggapan atas komentar / jawaban atas pertanyaan awal)
Disarankan bahwa teknik permutasi (di mana distribusi sampling I Moran dihasilkan menggunakan prosedur Monte Carlo) menawarkan solusi yang kuat. Pemahaman saya adalah bahwa tes tersebut menghilangkan kebutuhan untuk membuat asumsi tentang distribusi I Moran (mengingat bahwa statistik uji dapat dipengaruhi oleh struktur spasial dari dataset) tetapi, saya gagal untuk melihat bagaimana teknik permutasi mengoreksi non-normal data atribut terdistribusi . Saya menawarkan dua contoh: satu yang menunjukkan pengaruh data miring pada statistik I Moran lokal, yang lain pada I global Moran - bahkan di bawah tes permutasi.
Saya akan menggunakan Zhang et al. 's (2008) menganalisis sebagai contoh pertama. Dalam makalah mereka, mereka menunjukkan pengaruh distribusi data atribut pada Moran lokal saya menggunakan tes permutasi (9999 simulasi). Saya telah mereproduksi hasil hotspot penulis untuk konsentrasi timbal (Pb) (pada tingkat kepercayaan 5%) menggunakan data asli (panel kiri) dan transformasi log dari data yang sama (panel kanan) di GeoDa. Boxplot dari konsentrasi Pb asli dan yang diubah log juga disajikan. Di sini, jumlah hot spot signifikan hampir dua kali lipat ketika data ditransformasikan; contoh ini menunjukkan bahwa statistik lokal adalah sensitif terhadap distribusi data atribut - bahkan ketika menggunakan teknik Monte Carlo!
Contoh kedua (data simulasi) menunjukkan pengaruh data miring dapat memiliki pada Moran's I global , bahkan ketika menggunakan tes permutasi. Contoh, dalam R , berikut:
library(spdep)
library(maptools)
NC <- readShapePoly(system.file("etc/shapes/sids.shp", package="spdep")[1],ID="FIPSNO", proj4string=CRS("+proj=longlat +ellps=clrk66"))
rn <- sapply(slot(NC, "polygons"), function(x) slot(x, "ID"))
NB <- read.gal(system.file("etc/weights/ncCR85.gal", package="spdep")[1], region.id=rn)
n <- length(NB)
set.seed(4956)
x.norm <- rnorm(n)
rho <- 0.3 # autoregressive parameter
W <- nb2listw(NB) # Generate spatial weights
# Generate autocorrelated datasets (one normally distributed the other skewed)
x.norm.auto <- invIrW(W, rho) %*% x.norm # Generate autocorrelated values
x.skew.auto <- exp(x.norm.auto) # Transform orginal data to create a 'skewed' version
# Run permutation tests
MCI.norm <- moran.mc(x.norm.auto, listw=W, nsim=9999)
MCI.skew <- moran.mc(x.skew.auto, listw=W, nsim=9999)
# Display p-values
MCI.norm$p.value;MCI.skew$p.value
Perhatikan perbedaan dalam nilai-P. Data miring menunjukkan bahwa tidak ada pengelompokan pada tingkat signifikansi 5% (p = 0,167) sedangkan data yang terdistribusi normal menunjukkan bahwa ada (p = 0,013).
Chaosheng Zhang, Lin Luo, Weilin Xu, Valerie Ledwith, Penggunaan I dan GIS Moran lokal untuk mengidentifikasi titik-titik polusi Pb di tanah perkotaan di Galway, Irlandia, Ilmu Lingkungan Total, Volume 398, Masalah 1-3, 15 Juli 2008 , Halaman 212-221
sumber
Jawaban:
(Ini terlalu sulit pada saat ini untuk berubah menjadi komentar)
Ini berkaitan dengan tes lokal dan global (bukan ukuran, sampel independen dari korelasi otomatis). Aku dapat menghargai bahwa tertentu Moran saya ukuran adalah estimasi bias dari korelasi (menafsirkan dalam hal yang sama seperti koefisien korelasi Pearson), saya masih tidak melihat bagaimana tes hipotesis permutasi sensitif terhadap distribusi asli dari variabel ( baik dalam hal kesalahan tipe 1 atau tipe 2).
Sedikit adaptasi kode yang Anda berikan dalam komentar (bobot spasial
colqueen
tidak ada);Ketika seseorang melakukan tes permutasi (dalam hal ini, saya suka menganggapnya sebagai ruang jumbling) tes hipotesis auto-korelasi spasial global tidak boleh terpengaruh oleh distribusi variabel, karena distribusi uji simulasi pada dasarnya akan berubah dengan distribusi variabel asli. Kemungkinan seseorang dapat membuat simulasi yang lebih menarik untuk mendemonstrasikan ini, tetapi seperti yang dapat Anda lihat dalam contoh ini, statistik uji yang diamati jauh di luar distribusi yang dihasilkan untuk yang asli
PLUMB
dan yang dicatatPLUMB
(yang jauh lebih dekat dengan distribusi normal) . Meskipun Anda dapat melihat distribusi tes PLUMB yang dicatat di bawah nol bergeser lebih dekat ke simetri sekitar 0.Saya akan menyarankan ini sebagai alternatif, mengubah distribusi menjadi sekitar normal. Saya juga akan menyarankan mencari sumber daya pada penyaringan spasial (dan juga statistik Getis-Ord lokal dan global), meskipun saya tidak yakin ini akan membantu dengan skala pengukuran bebas juga (tapi mungkin mungkin bermanfaat untuk tes hipotesis) . Saya akan memposting kembali nanti dengan potensi lebih banyak literatur yang menarik.
sumber