Memperkirakan parameter untuk proses spasial

12

Saya diberi kisi-kisi nilai integer positif. Angka-angka ini mewakili intensitas yang harus sesuai dengan kekuatan kepercayaan seseorang yang menempati lokasi kisi itu (nilai yang lebih tinggi menunjukkan keyakinan yang lebih tinggi). Seseorang secara umum akan memiliki pengaruh terhadap banyak sel-sel jaringan.n×n

Saya percaya bahwa pola intensitas harus "terlihat Gaussian" karena akan ada lokasi sentral intensitas tinggi, dan kemudian intensitas meruncing secara radial ke segala arah. Secara khusus, saya ingin memodelkan nilai-nilai yang berasal dari "skala Gaussian" dengan parameter untuk varians dan lainnya untuk faktor skala.

Ada dua faktor yang menyulitkan:

  • tidak adanya seseorang tidak akan sesuai dengan nilai nol, karena kebisingan latar belakang dan efek lainnya, tetapi nilai harus lebih kecil. Mereka bisa tidak menentu, dan pada perkiraan pertama mungkin sulit untuk memodelkan sebagai noise Gaussian sederhana.
  • Kisaran intensitas dapat bervariasi. Misalnya, nilai mungkin berkisar antara 1 dan 10, dan yang lain, antara 1 dan 100.

Saya mencari strategi estimasi parameter yang sesuai, atau petunjuk ke literatur yang relevan. Pointer mengapa saya mendekati masalah ini dengan cara yang salah sama sekali juga akan dihargai :). Saya sudah membaca tentang kriging, dan proses Gaussian, tapi itu sepertinya mesin yang sangat berat untuk masalah saya.

Suresh Venkatasubramanian
sumber
1
Apa yang Anda maksud dengan Gaussian dengan parameter varians dan skala? Parameter varians adalah parameter skala dari Gaussian! Saya juga sedikit tidak yakin tentang model yang Anda buat sejauh ini. Bisakah Anda menggambarkan masalah yang sebenarnya ingin Anda selesaikan dengan lebih detail? Menggunakan Gaussian untuk memodelkan observasi bernilai integer granularitas rendah tampaknya mencurigakan.
kardinal
(+1) Untuk pertanyaan yang menarik. Berharap untuk memahami apa yang Anda coba selesaikan dengan sedikit lebih baik.
kardinal
Berikut adalah beberapa pengamatan: 1. Jika nilai Anda bilangan bulat, menggunakan Gaussian sepertinya tidak tepat. 2. Tidak jelas apa tujuan model Anda, apakah Anda ingin mengidentifikasi kelompok kepercayaan yang kuat misalnya? Apa yang akan menjadi interpretasi parameter Anda jika Anda memilikinya? 3. Karena Anda memiliki kisi, mengapa tidak mencoba menyesuaikan distribusi bivariat? Maka kisi-kisi akan menjadi pendukung distribusi (katakanlah satuan kuadrat) dan intensitas akan sesuai dengan daerah probabilitas tinggi.
mpiktas
Terima kasih atas poin yang menarik. Biarkan saya mencoba mengklarifikasi. Pilihan "Gaussian", dalam terang komentar, mungkin menjadi herring merah yang menyebabkan lebih banyak kebingungan daripada membantu. Fitur utama dari data adalah nilai intensitas tinggi pada titik kepercayaan tertinggi di lokasi orang tersebut, dan pengurangan "secara radial" di sekitarnya (yang saya amati secara empiris). Nilai-nilai intensitas berasal dari solusi untuk masalah invers (linier), dan karenanya sebenarnya tidak perlu menjadi integral - itu hanya data yang kita miliki.
Suresh Venkatasubramanian
tapi saya menghargai upaya untuk membuat pertanyaan lebih jelas dan dimodelkan dengan lebih baik. Saya akan melakukan yang terbaik untuk menjelaskan pengaturan data aktual sehingga menyatu pada asumsi pemodelan yang tepat.
Suresh Venkatasubramanian

Jawaban:

5

Anda dapat menggunakan modul pysal python library ini untuk metode analisis data spasial yang saya diskusikan di bawah ini.

Deskripsi Anda tentang bagaimana sikap setiap orang dipengaruhi oleh sikap orang-orang di sekitarnya dapat diwakili oleh model autoregresif spasial (SAR) (juga lihat penjelasan SAR sederhana saya dari jawaban SE 2 ini ). Pendekatan yang paling sederhana adalah dengan mengabaikan faktor-faktor lain, dan memperkirakan kekuatan pengaruh bagaimana orang-orang di sekitarnya mempengaruhi satu sama lain dengan menggunakan statistik I Moran .

Jika Anda ingin menilai pentingnya faktor lain sambil memperkirakan kekuatan pengaruh orang di sekitarnya, tugas yang lebih kompleks, maka Anda dapat memperkirakan parameter regresi: . Lihat dokumen di sini . (Metode estimasi jenis regresi ini berasal dari bidang ekonometrik spasial dan bisa jauh lebih canggih daripada referensi yang saya berikan.)y=bx+rhoWy+e

Tantangan Anda adalah membangun matriks bobot spasial ( ). Saya pikir setiap elemen dari matriks harus 1 atau 0 berdasarkan pada apakah orang berada dalam jarak tertentu Anda merasa bahwa itu diperlukan untuk mempengaruhi orang lain .w i j i jWwijij

Untuk mendapatkan ide intuitif masalah, di bawah ini saya menggambarkan bagaimana proses menghasilkan data autoregresif spasial (DGP) akan membuat pola nilai. Untuk 2 kisi nilai simulasi, blok putih mewakili nilai tinggi dan blok gelap mewakili nilai rendah.

Dalam kisi pertama di bawah ini nilai grid telah dihasilkan oleh proses acak yang terdistribusi normal (atau Gaussian), di mana adalah nol.rho

Acak (Gaussian)

Dalam kisi berikutnya di bawah nilai-nilai jaringan telah dihasilkan oleh proses autoregressive spasial, di mana memiliki telah ditetapkan untuk sesuatu yang tinggi, mengatakan 0,8. rhomasukkan deskripsi gambar di sini

b_dev
sumber
Itu sangat menarik (dan begitu juga Geary C terkait). Ini mungkin dekat dengan yang saya butuhkan.
Suresh Venkatasubramanian
Geary C membantu Anda melihat bagaimana nilai dekat satu sama lain, bahkan nilai di tengah distribusi. Moran's I membantu Anda melihat bagaimana nilai sangat tinggi mengelompok dengan nilai sangat tinggi, dan nilai sangat rendah mengelompok di sekitar nilai sangat rendah. Jadi mungkin Anda benar dan metode paling sederhana dan terbaik adalah Geary C. Ingat pendekatan C Geary adalah eksplorasi dan tidak akan membiarkan Anda mengkondisikan hasil Anda pada faktor-faktor lain. Lihatlah modul python ini untuk kode untuk menjalankan Geary's C: pysal.org/1.1/library/esda/geary.html .
b_dev
Biarkan saya bermain dengan ini lagi. Jika tampaknya melakukan apa yang saya butuhkan (dan saya pikir itu akan), ini terdengar seperti jawaban terbaik.
Suresh Venkatasubramanian
3

Berikut adalah ide sederhana yang mungkin berhasil. Seperti yang telah saya katakan di komentar jika Anda memiliki kotak dengan intensitas mengapa tidak cocok dengan kepadatan distribusi bivariat?

Berikut adalah contoh grafik untuk menggambarkan poin saya: masukkan deskripsi gambar di sini

Setiap titik kisi dengan ditampilkan sebagai kotak, diwarnai sesuai dengan intensitas. Ditumpangkan pada grafik adalah plot kontur dari plot kepadatan normal bivariat. Seperti yang Anda lihat garis kontur memanjang ke arah penurunan intensitas. Pusat akan dikendalikan oleh rata-rata bivariat normal dan penyebaran intensitas sesuai dengan matriks kovarians.

Untuk mendapatkan estimasi rata-rata dan matriks kovarians, optimasi numerik sederhana dapat digunakan, bandingkan intensitas dengan nilai-nilai fungsi kepadatan menggunakan mean dan matriks kovarians sebagai parameter. Minimalkan untuk mendapatkan perkiraan.

Ini tentu saja secara tegas bukan perkiraan statistik, tetapi setidaknya itu akan memberi Anda ide bagaimana untuk melangkah lebih jauh.

Berikut adalah kode untuk mereproduksi grafik:

require(mvtnorm)
sigma=cbind(c(0.1,0.7*0.1),c(0.7*0.1,0.1))

x<-seq(0,1,by=0.01)
y<-seq(0,1,by=0.01)
z<-outer(x,y,function(x,y)dmvnorm(cbind(x,y),mean=mean,sigma=sigma))

mz<-melt(z)

mz$X1<-(mz$X1-1)/100
mz$X2<-(mz$X2-1)/100

colnames(mz)<-c("x","y","z")

mz$intensity<-round(mz$z*1000)

ggplot(mz, aes(x,y)) + geom_tile(aes(fill = intensity), colour = "white") + scale_fill_gradient(low = "white",     high = "steelblue")+geom_contour(aes(z=z),colour="black")
mpiktas
sumber
2

X[i,j]X[i,j](X[i1,j1],...,X[im,jm])(X[i1+k,j1+l]...,X[im+k,jm+l])corr(X[i1,j1],X[i2,j2])d([i1,j1],[i2,j2])ρ(d)ρ(d)=kd1k

d([i1,j1],[i2,j2])=|i1i2|+|j1j2|ρ(d)misalnya melalui kemungkinan maksimum. Untuk gagasan lainnya, cari "bidang acak".

charles.y.zheng
sumber
1
"Ingin mengasumsikan stasioneritas spasial" tampaknya secara langsung bertentangan dengan asumsi OP bahwa "intensitas meruncing secara radial ke segala arah."
whuber
Bagaimana? Pola seperti itu akan terjadi pada struktur autokorelasi yang saya usulkan.
charles.y.zheng
1
@ charles Ini poin penting: jika memang kecenderungan yang jelas ini dikaitkan dengan autokorelasi, maka pada prinsipnya realisasi independen lain dari proses tersebut tampaknya memiliki tren yang sangat berbeda, seperti peningkatan nilai jauh dari titik pusat. Karena OP telah secara jelas mengartikulasikan dan membedakan beberapa elemen deterministik dengan tren ("radial tapering") dan elemen korelasional ("memiliki pengaruh terhadap banyak sel jaringan"), sebuah jawaban yang menghormati ini kemungkinan akan dilihat lebih positif daripada yang menegaskan OP "akan mau" berubah pikiran.
whuber
Saya tidak yakin saya memahami kondisi stasioneritas spasial. Di permukaan, tampaknya bertentangan dengan gagasan memiliki "puncak yang meruncing" di lokasi tertentu, tetapi saya jelas tidak memahami sesuatu.
Suresh Venkatasubramanian
1
@ charles, pola yang Anda gambarkan akan ada untuk setiap titik kisi, karena asumsi stasioneritas spasial. Stationaritas pada dasarnya mengatakan bahwa semua poin saya berperilaku sama. Ini bukan kasus yang dijelaskan oleh OP. Jawabannya masih sangat bagus, tetapi tidak sesuai untuk kasus ini.
mpiktas