Saya telah menghasilkan model aditif umum untuk deforestasi. Untuk menjelaskan autokorelasi spasial, saya telah memasukkan garis lintang dan garis bujur sebagai istilah interaksi yang dihaluskan (yaitu s (x, y)).
Saya mendasarkan ini pada membaca banyak makalah di mana penulis mengatakan 'untuk menjelaskan autokorelasi spasial, koordinat poin dimasukkan sebagai istilah yang dihaluskan' tetapi ini tidak pernah menjelaskan mengapa ini sebenarnya menjelaskan hal itu. Ini cukup membuat frustrasi. Saya telah membaca semua buku yang dapat saya temukan di GAM dengan harapan menemukan jawaban, tetapi sebagian besar (misalnya Generalized Additive Models, Pengantar dengan R, SN Wood) hanya menyentuh subjek tanpa menjelaskan.
Saya akan sangat menghargai jika seseorang dapat menjelaskan MENGAPA memasukkan akun lintang dan bujur untuk autokorelasi spasial, dan apa arti 'akuntansi' sebenarnya - apakah itu cukup untuk memasukkannya ke dalam model, atau Anda harus membandingkan model dengan s (x, y) dalam dan model tanpa? Dan apakah penyimpangan yang dijelaskan oleh istilah tersebut menunjukkan tingkat autokorelasi spasial?
Jawaban:
Masalah utama dalam setiap model statistik adalah asumsi yang mendasari prosedur inferensi. Dalam jenis model yang Anda gambarkan, residu dianggap independen. Jika mereka memiliki ketergantungan spasial dan ini tidak dimodelkan di bagian sistem model, residu dari model itu juga akan menunjukkan ketergantungan spasial, atau dengan kata lain mereka akan secara otomatis berkorelasi spasial. Ketergantungan seperti itu akan mematahkan teori yang menghasilkan nilai-p dari statistik uji dalam GAM misalnya; Anda tidak dapat mempercayai nilai-p karena nilai tersebut dihitung dengan asumsi independensi.
Anda memiliki dua opsi utama untuk menangani data tersebut; i) memodelkan ketergantungan spasial pada bagian sistematis dari model, atau ii) mengendurkan asumsi independensi dan memperkirakan korelasi antara residu.
i) adalah apa yang sedang dicoba dengan memasukkan kelancaran lokasi spasial dalam model. ii) memerlukan estimasi matriks korelasi residu sering selama pemasangan model menggunakan prosedur seperti kuadrat terkecil umum. Seberapa baik salah satu dari pendekatan ini menangani ketergantungan spasial akan tergantung pada sifat & kompleksitas ketergantungan spasial dan seberapa mudah dapat dimodelkan.
Singkatnya, jika Anda dapat memodelkan ketergantungan spasial antara pengamatan maka residu lebih cenderung menjadi variabel acak independen dan karenanya tidak melanggar asumsi prosedur inferensial apa pun.
sumber
"Autokorelasi spasial" berarti berbagai hal bagi berbagai orang. Namun, konsep menyeluruh adalah bahwa suatu fenomena yang diamati di lokasi dapat bergantung pada beberapa cara tertentu pada (a) kovariat, (b) lokasi, dan (c) nilainya di lokasi terdekat . (Di mana definisi teknis berbeda-beda terletak pada jenis data yang dipertimbangkan, apa "cara pasti" yang dipostulatkan, dan apa yang "terdekat" artinya: semua ini harus dibuat kuantitatif untuk diproses.)z
Untuk melihat apa yang mungkin terjadi, mari kita pertimbangkan contoh sederhana model spasial semacam itu untuk menggambarkan topografi suatu wilayah. Biarkan ketinggian yang diukur pada suatu titik menjadi . Salah satu model yang mungkin adalah bahwa tergantung pada beberapa cara matematika pasti pada koordinat , yang akan saya tulis dalam situasi dua dimensi ini. Membiarkan mewakili penyimpangan (hipotetis independen) antara pengamatan dan model (yang seperti biasanya diasumsikan memiliki nol harapan), kita dapat menulisz y(z) y z (z1,z2) ε
untuk model tren linier . Tren linear (diwakili oleh dan ) adalah salah satu cara untuk menangkap gagasan bahwa nilai terdekat dan , untuk close to , harus cenderung dekat satu sama lain. Kita bahkan dapat menghitung ini dengan mempertimbangkan nilai yang diharapkan dari ukuran perbedaan antara dan , . Ternyata matematika banyakβ1 β2 y(z) y(z′) z z′ y(z) y(z′) E[|y(z)−y(z′)|] lebih sederhana jika kita menggunakan ukuran perbedaan yang sedikit berbeda: sebagai gantinya, kita menghitung perbedaan kuadrat yang diharapkan :
Model ini bebas dari autokorelasi spasial eksplisit, karena tidak ada istilah di dalamnya yang secara langsung menghubungkan dengan nilai terdekat .y(z) y(z′)
Alternatif, berbeda, model mengabaikan tren linier dan hanya mengandaikan bahwa ada autokorelasi. Salah satu cara untuk melakukannya adalah melalui struktur penyimpangan . Kita mungkin menempatkan ituε(z)
dan, untuk memperhitungkan antisipasi kita terhadap korelasi, kita akan mengasumsikan semacam "struktur kovarians" untuk . Agar ini bermakna secara spasial, kita akan mengasumsikan kovarian antara dan , sama dengan karena memiliki rata-rata nol, cenderung berkurang karena dan menjadi semakin jauh. Karena detailnya tidak masalah, sebut saja kovarian . Ini adalah autokorelasi spasial.ε ε(z) ε(z′) E[ε(z)ε(z′)] ε z z′ C(z,z′) Memang, korelasi (biasanya Pearson) antara dan adalahy(z) y(z′)
Dalam notasi ini, perbedaan kuadrat sebelumnya yang diharapkan dari untuk model pertama adalahy
(dengan asumsi ) karena di lokasi yang berbeda telah diasumsikan independen. Saya telah menulis alih-alih untuk menunjukkan ini adalah fungsi kovarians untuk model pertama.z≠z′ ε C1 C
Ketika kovarian dari tidak bervariasi secara dramatis dari satu lokasi ke lokasi lain (memang, mereka biasanya dianggap konstan), persamaan ini menunjukkan bahwa perbedaan kuadrat yang diharapkan dalam meningkat secara kuadratik dengan pemisahan antara dan . Jumlah aktual peningkatan ditentukan oleh koefisien tren dan .ε y z z′ β0 β1
Mari kita lihat apa perbedaan kuadrat yang diharapkan pada model untuk model baru, model 2:y
Sekali lagi ini berperilaku dengan cara yang benar: karena kami memperkirakan akan berkurang ketika dan menjadi lebih terpisah, perbedaan kuadrat yang diharapkan dalam 's memang pergi naik dengan meningkatnya pemisahan lokasi.C2(z,z′) z z′ y
Membandingkan dua ekspresi untuk dalam dua model menunjukkan kepada kita yang dalam model pertama memainkan peran yang secara matematis identik dengan dalam model kedua. (Ada konstanta aditif yang mengintai di sana, terkubur dalam arti berbeda dari , tetapi tidak masalah dalam analisis ini.) Ergo , tergantung pada model, korelasi spasial biasanya digambarkan sebagai beberapa kombinasi tren dan struktur korelasi yang ditetapkan pada kesalahan acak.E[(y(z)−y(z′))2] (β1(z1−z′1)+β2(z2−z2)′)2 −2C2(z,z′) Ci(z,z)
Saya harap, sekarang kita memiliki jawaban yang jelas untuk pertanyaan: seseorang dapat mewakili gagasan di balik Hukum Geografi Tobler ("semuanya terkait dengan yang lain, tetapi hal-hal yang lebih dekat lebih terkait") dengan cara yang berbeda. Dalam beberapa model, Hukum Tobler diwakili secara memadai dengan memasukkan tren (atau istilah "drift") yang merupakan fungsi dari koordinat spasial seperti bujur dan lintang. Dalam kasus lain, Hukum Tobler ditangkap dengan menggunakan struktur kovarians nontrivial di antara istilah acak tambahan (theε ). Dalam praktiknya, model menggabungkan kedua metode. Yang mana yang Anda pilih tergantung pada apa yang ingin Anda capai dengan model dan pada pandangan Anda tentang bagaimana autokorelasi spasial muncul - apakah itu tersirat oleh tren yang mendasari atau mencerminkan variasi yang ingin Anda pertimbangkan secara acak. Tidak ada yang selalu benar dan, dalam masalah apa pun, sering kali mungkin menggunakan kedua jenis model untuk menganalisis data, memahami fenomena, dan memperkirakan nilainya di lokasi lain (interpolasi).
sumber
Jawaban lainnya bagus, saya hanya ingin menambahkan sesuatu tentang 'akuntansi untuk' autokorelasi spasial. Terkadang klaim ini dibuat lebih kuat di sepanjang garis "akuntansi untuk autokorelasi spasial yang tidak dijelaskan oleh kovariat".
Ini dapat menyajikan gambaran yang menyesatkan tentang apa yang dilakukan spasial halus. Ini tidak seperti ada beberapa antrian yang tertata dalam kemungkinan di mana smooth yang sabar menunggu kovariat untuk pergi terlebih dahulu dan kemudian smooth akan membersihkan bagian yang 'tidak dijelaskan'. Pada kenyataannya mereka semua mendapatkan kesempatan untuk menjelaskan data.
Makalah ini dengan judul yang diberi nama tepat menyajikan masalah ini dengan sangat jelas, meskipun dari sudut pandang model CAR prinsip-prinsip tersebut berlaku untuk smooth GAM.
Menambahkan Kesalahan yang Berkaitan secara Spasial Dapat Mengacaukan Efek Tetap yang Anda Cintai
'Solusi' dalam kertas adalah untuk menghaluskan residu alih-alih menghaluskan ruang. Itu akan berdampak membiarkan kovariat Anda menjelaskan apa yang mereka bisa. Tentu saja, ada banyak aplikasi di mana ini tidak akan menjadi solusi yang diinginkan.
sumber
Korelasi spasial adalah bagaimana koordinat x dan y berhubungan dengan besarnya permukaan yang dihasilkan dalam ruang. Jadi autokorelasi antar koordinat dapat dinyatakan dalam hubungan fungsional antara titik-titik tetangga.
sumber