Database (populasi, area, bentuk) dapat digunakan untuk memetakan kepadatan populasi dengan menetapkan nilai konstan populasi / area untuk setiap bentuk (yang merupakan poligon seperti blok Sensus, traktat, county, state, apa pun). Namun, populasi biasanya tidak terdistribusi secara seragam dalam poligonnya. Pemetaan Dasymetric adalah proses menyempurnakan estimasi kepadatan ini dengan menggunakan data tambahan. Ini adalah masalah penting dalam ilmu sosial seperti yang ditunjukkan oleh ulasan baru-baru ini .
Jadi, anggaplah bahwa kita telah menyediakan peta tambahan tutupan lahan (atau faktor diskrit lainnya). Dalam kasus yang paling sederhana, kita dapat menggunakan area yang jelas tidak bisa dihuni seperti waterbodies untuk menggambarkan di mana populasi tidak dan, dengan demikian, menugaskan semua populasi ke area yang tersisa. Lebih umum, masing-masing Sensus satuan diukir ke dalam bagian memiliki daerah permukaan , . Dataset kami karenanya ditambahkan ke daftar tupel
di mana adalah penduduk (diasumsikan diukur tanpa kesalahan) di unit j dan - meskipun hal ini tidak sepenuhnya kasus - kita bisa mengasumsikan setiap x j i juga persis diukur. Dalam hal ini, tujuannya adalah untuk partisi masing-masing y j menjadi penjumlahan
di mana setiap dan z j i memperkirakan populasi dalam unit j yang berada di kelas tutupan lahan i . Estimasi harus tidak bias. Partisi ini memurnikan peta kepadatan populasi dengan menetapkan kepadatan z j i / x j i ke persimpangan poligon Sensus ke- j dan kelas tutupan lahan ke- i .
Masalah ini berbeda dari pengaturan regresi standar dalam cara yang menonjol:
- Partisi setiap harus tepat.
- Komponen setiap partisi harus non-negatif.
- Tidak ada kesalahan dalam data apa pun: semua populasi menghitung dan semua area x j i benar.
Ada banyak pendekatan untuk solusi, seperti metode " pemetaan dasymetric cerdas ", tetapi semua yang saya baca memiliki elemen ad hoc dan potensi yang jelas untuk bias. Saya mencari jawaban yang menyarankan metode statistik yang kreatif dan dapat ditelusuri secara komputasional. Aplikasi langsung menyangkut koleksi c. - 10 6 Unit sensus rata-rata masing-masing 40 orang (walaupun sebagian besar memiliki 0 orang) dan sekitar selusin kelas tutupan lahan.
sumber
Jawaban:
Anda mungkin ingin memeriksa karya Mitchel Langford pada pemetaan dasymetric.
Dia membangun raster yang mewakili distribusi populasi Wales dan beberapa pendekatan metodologisnya mungkin berguna di sini.
Update: Anda mungkin juga kita lihat karya Jeremy Mennis (terutama ini dua artikel).
sumber
Pertanyaan menarik. Berikut adalah langkah tentatif untuk mendekati ini dari sudut statistik. Misalkan kita menemukan cara untuk menetapkan jumlah populasi untuk setiap area . Nyatakan hubungan ini sebagai berikut:xji
Jelas, bentuk fungsional apa pun yang kita berikan pada Akan menjadi pendekatan terbaik untuk hubungan nyata dan dengan demikian kebutuhan untuk memasukkan kesalahan ke dalam persamaan di atas. Dengan demikian, di atas menjadi:f(.)
dimana,
Asumsi kesalahan distribusi pada istilah kesalahan adalah untuk tujuan ilustrasi. Jika perlu kami dapat mengubahnya sesuai kebutuhan.
However, we need an exact decomposition ofyji . Thus, we need to impose a constraint on the error terms and the function f(.) as below:
Denote the stacked vector ofzji by zj and the stacked deterministic terms of f(xji,β) by fj . Thus, we have:
where,
The first indicator constraint captures the idea that the sum of the deterministic terms should sum toyj and the second one captures the idea that the error residuals should sum to 0.
Model selection is trickier as we are decomposing the observedyj exactly. Perhaps, a way to approach model selection is to choose the model that yields the lowest error variance i.e., the one that yields the lowest estimate of σ2 .
Edit 1
Thinking some more the above formulation can be simplified as it has more constraints than needed.
where,
Denote the stacked vector ofzji by zj and the stacked deterministic terms of f(xji,β) by fj . Thus, we have:
where,
The constraint onzj ensures an exact decomposition.
sumber