Pemodelan tren spasial dengan regresi dengan koordinat

9

Saya berencana untuk memasukkan koordinat sebagai kovariat dalam persamaan regresi untuk menyesuaikan dengan tren spasial yang ada dalam data. Setelah itu, saya ingin menguji residu pada autokorelasi spasial dalam variasi acak. Saya punya beberapa pertanyaan:

  1. Haruskah saya melakukan regresi linier di mana hanya variabel bebas yang koordinat x dan y dan kemudian menguji residu pada autokorelasi spasial, atau haruskah saya lebih suka memasukkan tidak hanya koordinat sebagai kovariat tetapi juga variabel lain dan kemudian menguji residu.

  2. Jika saya berharap memiliki tren kuadratik, dan kemudian memasukkan tidak hanya x,y , tetapi juga, xy , x2 dan y2 , tetapi kemudian beberapa dari mereka ( xy dan y2 ) memiliki hal -nilai lebih tinggi dari ambang --haruskah saya mengecualikan variabel tersebut dengan nilai lebih tinggi halsebagai tidak signifikan? Bagaimana seharusnya saya mengartikan tren itu, sudah pasti tidak kuadratik lagi?

  3. Saya kira saya harus memperlakukan koordinat dan y sebagai kovariat lainnya, dan mengujinya pada memiliki hubungan linier dengan variabel dependen dengan membangun plot residual parsial ... tapi kemudian setelah saya mengubahnya (jika mereka menunjukkan mereka membutuhkan transformasi), itu tidak akan menjadi tren semacam itu lagi (terutama jika saya memasukkan x y , x 2 dan y 2 untuk tren kuadratik). Mungkin menunjukkan bahwa x 2 , misalnya, perlu transformasi, sementara x tidak atau lebih? Bagaimana saya harus bereaksi dalam situasi ini?xyxyx2y2x2x

Terima kasih.

Beka
sumber

Jawaban:

3

Saya pikir Anda mungkin lebih baik menyesuaikan model efek campuran linier dengan efek acak berkorelasi spasial (kadang-kadang disebut model geostatistik ). Dengan asumsi data Anda adalah Gaussian, Anda menentukan model formulir:

Ysaya=μsaya+Ssaya+ϵsaya,

untuk pengamatan 1 i n , dengan ε ~ N ( 0 , τ 2 ) mewakili kesalahan iid dan S ~ M V N ( 0 , σ 2 R ) mewakili istilah spasial Anda (di mana S = { S 1 , . . . , S n } ). Mean μ i bisa menjadi fungsi kovariat lainnya (yaitu μn1inϵN(0,τ2)SMVN(0,σ2R)S={S1,...,Sn}μi dll) atau bisa saja berupa konstanta (mungkin yang terbaik untuk memulai dengan yang terakhir untuk kesederhanaan).μi=β0+β1xi1+β2xi2

Matriks korelasi untuk istilah spasial (yang menentukan bagaimana Anda berkorelasi menurut setiap pengamatan seharusnya) dapat ditentukan dengan melihat variogram empiris. Umumnya korelasi antara pengamatan dipilih hanya bergantung pada jarak di antara mereka (di sinilah koordinat Anda masuk ke dalam model).R

Bab 2 geostatistik berbasis Model oleh Diggle dan Ribeiro (2000) akan memberi Anda pengantar yang lebih rinci. Paket R geoR memiliki banyak prosedur untuk pemasangan model geostatistik, sehingga Anda mungkin merasa berguna (lihat http://cran.r-project.org/web/packages/geoR/geoR.pdf ).

Sam Livingstone
sumber