Saya memiliki dataset nasional ~ 1,4 juta rumah tangga. Di sana saya memiliki informasi tentang sewa, ukuran (jumlah kamar dan m2) dan beberapa karakteristik tambahan dari setiap rumah tangga.
Saya ingin menggunakan data ini untuk membuat permukaan harga sewa untuk seluruh negara dan menggunakan informasi ini sebagai proksi untuk estimasi nilai sisa ~ 1,5 juta rumah tangga yang dimiliki atau tidak memiliki informasi sewa.
Beberapa pertanyaan di sini:
Apakah pendekatan semacam itu cocok untuk masalah semacam ini?
Metode interpolasi mana yang paling cocok untuk digunakan di sini?
Juga, apakah mungkin untuk mengambil informasi tentang, misalnya ukuran rumah tangga?
Saya menggunakan ArcGIS 9.3 dengan lisensi ArcInfo.
Jawaban:
Idenya bagus tetapi implementasi yang diusulkan mungkin terlalu sederhana untuk dapat dipercaya. Sewa adalah milik sistem ekonomi. Selain dipengaruhi oleh lokasi, mereka terkait dengan variabel ekonomi lainnya dengan cara penting: keadaan ekonomi lokal (dan nasional), harga perumahan lokal, ketersediaan modal, tingkat pekerjaan, dll. Untuk melakukan pekerjaan dengan baik, Anda memerlukan model ekonometrik . Mungkin bermanfaat dengan memiliki beberapa istilah spasial , tetapi sebelum komplikasi tersebut dipertimbangkan, Anda perlu memasukkan banyak kovariat ekonomi ini.
Karena itu, kemampuan Anda untuk sukses tergantung pada hubungan antara data yang Anda miliki dan sewa yang ingin Anda prediksi. Jika data Anda adalah sampel representatif dari seluruh negara dan tersebar secara geografis - anggap rumah sebagai kismis pada cookie dan Anda memiliki data tentang setiap kismis lain dalam cookie - maka model yang relatif sederhana mungkin cukup. Jika data Anda terfokus secara geografis - mungkin Anda memiliki informasi tentang kismis di sisi kanan cookie dan Anda ingin membuat prediksi untuk kismis di sisi kiri - maka masalahnya adalah yang lebih sulit.
Titik tolak yang baik adalah menyesuaikan model ekonometrika linier konvensional dengan karakteristik rumah tangga dan karakteristik spasial bruto (seperti kebijakan pajak negara bagian atau daerah), menghitung residu, dan mulai mengeksplorasi residu secara spasial (menggunakan variografi , smooths kernel spasial , dll) untuk menangkap efek geografis.
Perangkat lunak yang sesuai tersedia sebagai add-ons untuk R .
sumber
Sebagai pengantar yang sangat lembut untuk topik-topik tentang regresi spasial saya akan sangat merekomendasikan memeriksa buku kerja GeoDa (bab 22 hingga 25 akan menjadi yang paling menarik). Bahkan jika Anda tidak ingin menggunakan perangkat lunak itu adalah gambaran yang sangat komprehensif dari regresi spasial.
Apakah fungsi regresi bawaan di ArcMap menangani data sebanyak itu (bukankah perangkat lunak mana pun akan mengalami kesulitan dengan banyak poin?)
sumber
Saya telah melihat pekerjaan serupa dilakukan untuk harga rumah menggunakan pemodelan hedonis. Lihat http://scholar.google.com/scholar?hl=id&q=hedonic+price+geography untuk contoh.
sumber