autokorelasi spasial untuk data deret waktu

11

Saya memiliki dataset 20-tahun dari jumlah tahunan kelimpahan spesies untuk satu set poligon (~ 200 poligon kontinu berbentuk tidak teratur). Saya telah menggunakan analisis regresi untuk menyimpulkan tren (perubahan dalam hitungan per tahun) untuk setiap poligon, serta agregasi data poligon berdasarkan batas manajemen.

Saya yakin bahwa ada autokorelasi spasial dalam data, yang pasti akan berdampak pada analisis regresi untuk data agregat. Pertanyaan saya adalah - bagaimana cara menjalankan tes SAC untuk data deret waktu? Apakah saya perlu melihat SAC residu dari regresi saya untuk setiap tahun (global Moran's I)? Atau bisakah saya menjalankan satu tes dengan semua tahun?

Setelah saya uji ya ada SAC, adakah yang mudah untuk mengatasinya? Latar belakang statistik saya minimal dan semua yang saya baca tentang pemodelan spatio-temporal terdengar sangat kompleks. Saya tahu bahwa R memiliki fungsi autocovariate berbobot jarak - apakah ini mudah digunakan?

Saya benar-benar bingung bagaimana cara menilai / menambahkan SAC untuk masalah ini dan akan sangat menghargai setiap saran, tautan, atau referensi. Terima kasih sebelumnya!

Rozza
sumber
1
Apakah Anda ingin memodelkan proses spasial yang mendasarinya, atau Anda ingin menyesuaikan estimasi matriks varians-kovarians Anda dengan memperhitungkan autokorelasi spasial?
generic_user
1
Atau apakah Anda ingin melakukan keduanya ...
gregmacfarlane
Terima kasih atas jawaban Anda! Saya pikir bahwa data saya memang memiliki autodependensi spasial - ini adalah biologis dan sangat mungkin bahwa jumlah spesies di unit tetangga akan berdampak pada unit di sekitarnya. Unit saya cukup besar, jadi saya bermaksud menggunakan opsi 'connecting on edge and corner' untuk mengatur jarak jeda untuk menguji SAC. Fungsi R untuk model SAC terlihat bisa dilakukan (masih di atas kepala saya!). Terima kasih lagi.
Rozza
Selamat datang di situs Rozza, ini harus dibiarkan sebagai komentar untuk salah satu jawaban. Meskipun pastikan untuk memutakhirkan jawaban yang ada jika mereka memberikan tanggapan yang bermanfaat, dan tandai salah satu dari mereka menjawab pertanyaan Anda jika Anda merasa telah ditangani dengan memuaskan.
Andy W

Jawaban:

5

Menurut makalah ini , OLS konsisten dengan adanya autokorelasi spasial, tetapi kesalahan standar tidak benar dan perlu disesuaikan. Solomon Hsiang menyediakan stata dan kode matlab untuk melakukannya. Sayangnya saya tidak terbiasa dengan kode R untuk ini.

Tentu saja ada pendekatan lain untuk masalah semacam ini dalam statistik spasial yang secara eksplisit memodelkan proses spasial. Yang ini hanya mengembang kesalahan standar.

Sayangnya para ahli ekonometrik teoretis tampaknya senang mengaburkan. Kertas yang ditautkan sangat sulit dibaca. Pada dasarnya yang dikatakannya adalah menjalankan regresi apa pun yang Anda inginkan, dan kemudian perbaiki kesalahan standar nanti yaitu: menggunakan kode dari Hsiang. Ruang tidak muncul sampai Anda mencoba memperkirakan varians dari estimator Anda. Secara intuitif, jika semua perbedaannya berdekatan, Anda kurang yakin bahwa perkiraan Anda bukan hanya peninggalan dari beberapa kejutan spasial yang tidak teramati.

Perhatikan bahwa Anda perlu menentukan bandwidth kernel di mana Anda pikir proses spasial mungkin beroperasi.

Jawaban ini pada dasarnya adalah salinan / tempel pengulangan dari jawaban serupa yang saya buat di sini

generic_user
sumber
5

Jika masalah ini adalah kesalahan autokorelasi, , maka OLS konsisten tetapi tidak efisien, seperti kata ACD. Ini seperti korelasi serial dalam ekonometrik deret waktu.y=Xβ+u,u=ρWu+ϵ

Tetapi jika ada autodependensi spasial (juga disebut autokorelasi, membingungkan), , maka OLS tidak konsisten. Itu sama dengan variabel bias yang hilang. Jika Anda memiliki kedua masalah tersebut, Anda perlu menggunakan Model Durbin Spasial, .y=ρWy+Xβ+ϵy=ρWy+Xβ+WXλ+ϵ

The spdep paket untuk R mengandung banyak fungsi yang menghitung bobot spasial matriks, memperkirakan regresi spasial, dan melakukan hal-hal lain. Saya punya banyak pengalaman dengan lagsarlmfungsi - fungsi, tetapi lihat dalam dokumentasi paket bahwa ada sacsarlmfungsi yang tampaknya lebih dari apa yang Anda cari.

Sejauh aspek temporal dari masalah Anda, asumsi yang Anda buat tentang ketergantungan akan sangat menentukan spesifikasi model Anda. Apakah area Anda berinteraksi satu sama lain secara langsung? Contohnya adalah pasar perdagangan atau perumahan; ekspor dari satu negara sangat bergantung pada impor di negara lain, dan harga jual rumah yang baru dibeli merupakan kontribusi yang sangat penting bagi harga jual rumah di sekitarnya. Dalam hal ini, masuk akal untuk menentukan bobot Anda matriks untuk mengakomodasi ketergantungan ini. Izinkan rumah yang dibeli di waktu menjadi "tetangga" dengan rumah di waktu , tetapi tidak dengan rumah di waktuWtt1t+1

WX

gregmacfarlane
sumber
1
Pos yang bagus. Saya pikir perbedaan yang harus diingat OP ketika memilih antara dua pendekatan adalah apakah "hasil" dalam satu poligon akan mempengaruhi hasil dari tetangga-tetangganya. Jika demikian, gunakan pendekatan gmacfarlane. Jika tidak, yang saya usulkan lebih sederhana.
generic_user