Pemodelan harga sewa - metode interpolasi mana yang akan digunakan?

13

Saya memiliki dataset nasional ~ 1,4 juta rumah tangga. Di sana saya memiliki informasi tentang sewa, ukuran (jumlah kamar dan m2) dan beberapa karakteristik tambahan dari setiap rumah tangga.

Saya ingin menggunakan data ini untuk membuat permukaan harga sewa untuk seluruh negara dan menggunakan informasi ini sebagai proksi untuk estimasi nilai sisa ~ 1,5 juta rumah tangga yang dimiliki atau tidak memiliki informasi sewa.

Beberapa pertanyaan di sini:

Apakah pendekatan semacam itu cocok untuk masalah semacam ini?

Metode interpolasi mana yang paling cocok untuk digunakan di sini?

Juga, apakah mungkin untuk mengambil informasi tentang, misalnya ukuran rumah tangga?

Saya menggunakan ArcGIS 9.3 dengan lisensi ArcInfo.

Radek
sumber
1
Sepertinya sistem Computer Aided Mass Appraisal (CAMA) perlu melakukan sesuatu yang serupa. Saya bertanya-tanya bagaimana mereka menanganinya. en.wikipedia.org/wiki/Computer_Assisted_Mass_Appraisal
Kirk Kuykendall

Jawaban:

10

Idenya bagus tetapi implementasi yang diusulkan mungkin terlalu sederhana untuk dapat dipercaya. Sewa adalah milik sistem ekonomi. Selain dipengaruhi oleh lokasi, mereka terkait dengan variabel ekonomi lainnya dengan cara penting: keadaan ekonomi lokal (dan nasional), harga perumahan lokal, ketersediaan modal, tingkat pekerjaan, dll. Untuk melakukan pekerjaan dengan baik, Anda memerlukan model ekonometrik . Mungkin bermanfaat dengan memiliki beberapa istilah spasial , tetapi sebelum komplikasi tersebut dipertimbangkan, Anda perlu memasukkan banyak kovariat ekonomi ini.

Karena itu, kemampuan Anda untuk sukses tergantung pada hubungan antara data yang Anda miliki dan sewa yang ingin Anda prediksi. Jika data Anda adalah sampel representatif dari seluruh negara dan tersebar secara geografis - anggap rumah sebagai kismis pada cookie dan Anda memiliki data tentang setiap kismis lain dalam cookie - maka model yang relatif sederhana mungkin cukup. Jika data Anda terfokus secara geografis - mungkin Anda memiliki informasi tentang kismis di sisi kanan cookie dan Anda ingin membuat prediksi untuk kismis di sisi kiri - maka masalahnya adalah yang lebih sulit.

Titik tolak yang baik adalah menyesuaikan model ekonometrika linier konvensional dengan karakteristik rumah tangga dan karakteristik spasial bruto (seperti kebijakan pajak negara bagian atau daerah), menghitung residu, dan mulai mengeksplorasi residu secara spasial (menggunakan variografi , smooths kernel spasial , dll) untuk menangkap efek geografis.

Perangkat lunak yang sesuai tersedia sebagai add-ons untuk R .

whuber
sumber
@whubber Tautan ke dokumen yang menjelaskan variografi tampaknya sudah mati. Apakah ada peluang untuk memperbaruinya?
radek
1
Terima kasih, @radek. Sangatlah sulit menemukan eksposisi variografi di Web yang bersifat perkenalan namun akurat dan bukan hanya manual perangkat lunak. Saya menemukan tesis PhD baru-baru ini bahwa - menilai dari abstrak dan pengantar - tampaknya jelas dan menyeluruh dan dimulai dari titik yang relatif dasar.
Whuber
7

Sebagai pengantar yang sangat lembut untuk topik-topik tentang regresi spasial saya akan sangat merekomendasikan memeriksa buku kerja GeoDa (bab 22 hingga 25 akan menjadi yang paling menarik). Bahkan jika Anda tidak ingin menggunakan perangkat lunak itu adalah gambaran yang sangat komprehensif dari regresi spasial.

Apakah fungsi regresi bawaan di ArcMap menangani data sebanyak itu (bukankah perangkat lunak mana pun akan mengalami kesulitan dengan banyak poin?)

Andy W
sumber
3
(+1) 1,4 juta poin tidak ada masalah untuk regresi. (Upaya dalam algoritma kuadrat terkecil, misalnya, biasanya sebanding dengan kubus dari jumlah variabel. Menyiapkan persamaan hanya memerlukan satu pemindaian cepat melalui dataset.) Masalah sebenarnya adalah bahwa 1,4 juta kasus akan kaya dan struktur rinci: analisis yang baik akan sangat padat karya. (Dataset ini dapat menghasilkan banyak tesis PhD dalam bidang ekonomi, saya yakin.) Oleh karena itu triknya adalah melakukan pekerjaan sebanyak yang diperlukan untuk mendapatkan jawaban yang cukup akurat dan dapat dipertahankan untuk tugas yang sedang dihadapi.
whuber
3

Saya telah melihat pekerjaan serupa dilakukan untuk harga rumah menggunakan pemodelan hedonis. Lihat http://scholar.google.com/scholar?hl=id&q=hedonic+price+geography untuk contoh.

Ian Turton
sumber
2
(+1) Saya setuju literatur tentang model hedonis harga rumah sebagian besar berlaku untuk pertanyaan ini. Saya membingkai ulang dari menyarankan itu sebagai individu yang tidak terbiasa dengan regresi mungkin menemukan pekerjaan semua ekonometrik itu menakutkan (saya tahu saya kadang-kadang melakukannya!) Teori bijaksana meskipun itu akan menjadi literatur yang baik untuk memeriksa, terutama untuk kovariat bunga.
Andy W