Saya ingin menjalankan regresi logistik biner untuk memodelkan ada atau tidaknya konflik (variabel dependen) dari serangkaian variabel independen selama periode 10 tahun (1997-2006), dengan setiap tahun memiliki 107 pengamatan. Independen saya adalah:
- degradasi lahan (dikategorikan untuk 2 jenis degradasi);
- pertambahan populasi (0- tidak; 1-ya);
- tipe mata pencaharian (0 - tipe satu; 1 - tipe dua);
- kepadatan populasi (tiga tingkat kepadatan);
- NDVI berkelanjutan (maks. Produktivitas sayuran);
- NDVI t - 1 (penurunan sayuran dari tahun sebelumnya - 0 - no; 1 -ya) dan
- dan NDVI t - 2 (penurunan vegan dari dua tahun lalu - 0- tidak; 1- ya).
Saya cukup baru dalam hal ini - ini adalah proyek yang diberikan dosen saya - dan karenanya saya akan berterima kasih atas beberapa saran atau bimbingan. Saya sudah menguji multikoliniaritas.
Pada dasarnya data saya dibagi menjadi 107 unit pengamatan (wilayah spasial) yang mencakup 10 tahun (total 1070) dan untuk setiap unit pengamatan itu memberikan nilai kondisi 'snapshot' dari variabel independen pada waktu itu dalam unit tersebut ( wilayah). Saya ingin tahu cara mengatur regresi logistik (atau tabel) saya untuk mengenali 107 nilai setiap tahun secara terpisah sehingga perubahan NDVI temporal antara tahun unit yang berbeda dapat dinilai?
sumber
Jawaban:
Ini sebenarnya adalah masalah yang sangat canggih dan permintaan sulit dari dosen Anda!
Dalam hal bagaimana Anda mengatur data Anda, persegi panjang 1070 x 10 baik-baik saja. Misalnya, dalam R:
Untuk memasang model, fungsi glm () seperti yang disarankan @ gui11aume akan menjadi dasar ...
... tetapi ini memiliki masalah yang memperlakukan "negara" (saya berasumsi Anda memiliki negara sebagai 107 unit Anda) sebagai efek tetap, sedangkan efek acak lebih tepat. Ini juga memperlakukan periode sebagai faktor sederhana, tidak ada autokorelasi yang diizinkan.
Anda dapat mengatasi masalah pertama dengan model efek campuran linier umum seperti pada paket lme4 misalnya Bates et al di R. Ada pengantar yang bagus untuk beberapa aspek di sini . Sesuatu seperti
akan menjadi langkah maju.
Sekarang masalah terakhir Anda adalah autokorelasi di 10 periode Anda. Pada dasarnya, 10 poin data Anda di masing-masing negara tidak bernilai sama seperti jika mereka 10 poin yang dipilih secara independen dan identik. Saya tidak mengetahui solusi perangkat lunak yang tersedia secara luas untuk autokorelasi dalam residu model multilevel dengan respons non-Normal. Tentu saja ini tidak diimplementasikan di lme4. Orang lain mungkin tahu lebih banyak dari saya.
sumber
Tutorial ini komprehensif.
Dalam R, Anda perlu menyiapkan data Anda, misalkan variabel
data
dalam adata.frame
, kolom pertama di antaranya adalah variabel 0-1 Anda (konflik) dan kolom lainnya adalah prediktornya. Untuk variabel kategori, Anda harus memastikan bahwa mereka bertipefactor
. Untuk memastikan bahwa kolom 3, katakanlah, memiliki properti ini, Anda bisa memberlakukannya olehdata[,3] <- as.factor(data[,3])
.Maka itu hanya masalah
Ini secara implisit mengasumsikan bahwa Anda memiliki model aditif dan memberi Anda nilai estimasi. Untuk mendapatkan hasil yang lebih komprehensif, dengan uji parameter individual, Anda bisa melakukannya
sumber