Saya diberi kisi-kisi nilai integer positif. Angka-angka ini mewakili intensitas yang harus sesuai dengan kekuatan kepercayaan seseorang yang menempati lokasi kisi itu (nilai yang lebih tinggi menunjukkan keyakinan yang lebih tinggi). Seseorang secara umum akan memiliki pengaruh terhadap banyak sel-sel jaringan.
Saya percaya bahwa pola intensitas harus "terlihat Gaussian" karena akan ada lokasi sentral intensitas tinggi, dan kemudian intensitas meruncing secara radial ke segala arah. Secara khusus, saya ingin memodelkan nilai-nilai yang berasal dari "skala Gaussian" dengan parameter untuk varians dan lainnya untuk faktor skala.
Ada dua faktor yang menyulitkan:
- tidak adanya seseorang tidak akan sesuai dengan nilai nol, karena kebisingan latar belakang dan efek lainnya, tetapi nilai harus lebih kecil. Mereka bisa tidak menentu, dan pada perkiraan pertama mungkin sulit untuk memodelkan sebagai noise Gaussian sederhana.
- Kisaran intensitas dapat bervariasi. Misalnya, nilai mungkin berkisar antara 1 dan 10, dan yang lain, antara 1 dan 100.
Saya mencari strategi estimasi parameter yang sesuai, atau petunjuk ke literatur yang relevan. Pointer mengapa saya mendekati masalah ini dengan cara yang salah sama sekali juga akan dihargai :). Saya sudah membaca tentang kriging, dan proses Gaussian, tapi itu sepertinya mesin yang sangat berat untuk masalah saya.
sumber
Jawaban:
Anda dapat menggunakan modul pysal python library ini untuk metode analisis data spasial yang saya diskusikan di bawah ini.
Deskripsi Anda tentang bagaimana sikap setiap orang dipengaruhi oleh sikap orang-orang di sekitarnya dapat diwakili oleh model autoregresif spasial (SAR) (juga lihat penjelasan SAR sederhana saya dari jawaban SE 2 ini ). Pendekatan yang paling sederhana adalah dengan mengabaikan faktor-faktor lain, dan memperkirakan kekuatan pengaruh bagaimana orang-orang di sekitarnya mempengaruhi satu sama lain dengan menggunakan statistik I Moran .
Jika Anda ingin menilai pentingnya faktor lain sambil memperkirakan kekuatan pengaruh orang di sekitarnya, tugas yang lebih kompleks, maka Anda dapat memperkirakan parameter regresi: . Lihat dokumen di sini . (Metode estimasi jenis regresi ini berasal dari bidang ekonometrik spasial dan bisa jauh lebih canggih daripada referensi yang saya berikan.)y= b x + r h o Wy+ e
Tantangan Anda adalah membangun matriks bobot spasial ( ). Saya pikir setiap elemen dari matriks harus 1 atau 0 berdasarkan pada apakah orang berada dalam jarak tertentu Anda merasa bahwa itu diperlukan untuk mempengaruhi orang lain .w i j i jW wsaya j saya j
Untuk mendapatkan ide intuitif masalah, di bawah ini saya menggambarkan bagaimana proses menghasilkan data autoregresif spasial (DGP) akan membuat pola nilai. Untuk 2 kisi nilai simulasi, blok putih mewakili nilai tinggi dan blok gelap mewakili nilai rendah.
Dalam kisi pertama di bawah ini nilai grid telah dihasilkan oleh proses acak yang terdistribusi normal (atau Gaussian), di mana adalah nol.r h o
Dalam kisi berikutnya di bawah nilai-nilai jaringan telah dihasilkan oleh proses autoregressive spasial, di mana memiliki telah ditetapkan untuk sesuatu yang tinggi, mengatakan 0,8.r h o
sumber
Berikut adalah ide sederhana yang mungkin berhasil. Seperti yang telah saya katakan di komentar jika Anda memiliki kotak dengan intensitas mengapa tidak cocok dengan kepadatan distribusi bivariat?
Berikut adalah contoh grafik untuk menggambarkan poin saya:
Setiap titik kisi dengan ditampilkan sebagai kotak, diwarnai sesuai dengan intensitas. Ditumpangkan pada grafik adalah plot kontur dari plot kepadatan normal bivariat. Seperti yang Anda lihat garis kontur memanjang ke arah penurunan intensitas. Pusat akan dikendalikan oleh rata-rata bivariat normal dan penyebaran intensitas sesuai dengan matriks kovarians.
Untuk mendapatkan estimasi rata-rata dan matriks kovarians, optimasi numerik sederhana dapat digunakan, bandingkan intensitas dengan nilai-nilai fungsi kepadatan menggunakan mean dan matriks kovarians sebagai parameter. Minimalkan untuk mendapatkan perkiraan.
Ini tentu saja secara tegas bukan perkiraan statistik, tetapi setidaknya itu akan memberi Anda ide bagaimana untuk melangkah lebih jauh.
Berikut adalah kode untuk mereproduksi grafik:
sumber
sumber