Nilai kosong dalam Analisis Regresi Tertimbang secara Geografis

12

Beberapa variabel penjelas saya memiliki beberapa nilai nol untuk poligon tertentu.

Dapatkah Analisis Regresi Tertimbang secara Geografis menangani ini, atau haruskah saya menghapus seluruh poligon dan semua data (variabel dependen dan independen untuk poligon tertentu)?

I Heart Beats
sumber
Apa yang diwakili oleh nol ini? Bahwa nilai tidak berlaku atau memang ada tetapi tidak diketahui? Jika yang terakhir, mengapa tidak diketahui? (Perhatian utama adalah apakah alasan untuk nilai yang tidak diketahui dengan cara apa pun terkait dengan nilai itu sendiri; misalnya, jika Anda mempelajari hidrologi dan menggunakan tutupan lahan sebagai variabel penjelas, maka jika tutupan lahan tidak diketahui karena banjir, itu informasi penting dan berarti lebih dari sekadar nilai yang hilang.)
whuber
1
Terima kasih whuber, Beberapa nol mewakili data yang dihilangkan untuk kerahasiaan karena unit agregasi kecil, yang lain tidak tersedia tetapi tidak sebagai hasil dari variabel penjelas yang mempengaruhi varibales lain. Saya memiliki nilai nol sejati dimana, nol mewakili tidak ada event / rate untuk poligon tertentu dan saya juga memiliki beberapa nilai nol di mana data hilang. Karena saya memiliki sekitar 29 variabel penjelas untuk memulai, jika saya mengeluarkan poligon di mana untuk baris yang berisi nol, saya kehilangan 8 poligon dari 279 dan saya berharap saya tidak harus melakukannya. Terima kasih!
I Heart Beats
Saya senang Anda memiliki informasi dan teori tentang ketiadaan. Anda mungkin ingin sedikit berhati-hati tentang unit-unit kecil itu, karena nilai dari hampir semua variabel bisa masuk akal terkait dengan ukuran wilayah yang diwakilinya, sehingga menciptakan bias potensial dalam pola ketiadaan.
whuber
2
Anda dapat memasukkan nol dengan memperkenalkan variabel untuk menunjukkan keberadaannya dan menyandikan semua hasil nol asli dengan nilai umum (nilai yang Anda pilih tidak terlalu penting). Anda akan memerlukan satu indikator terpisah untuk setiap variabel yang berisi null. Apa pun yang Anda lakukan, jangan hanya mengganti nol dengan nol (atau konstanta lainnya)! Nol berarti sesuatu yang sama sekali berbeda dari nol.
whuber
1
@whuber Sepertinya ada cukup banyak komentar Anda untuk menuliskan jawaban yang satu ini.
PolyGeo

Jawaban:

1

Anda dapat mencoba menebak nilai 'nol' dari data di sekitarnya. Itu akan lebih baik daripada meninggalkan mereka, karena dengan begitu Anda tidak akan kehilangan data. Tentu saja Anda harus berhati-hati dalam bagaimana Anda menebak nilainya. Karena jika tebakan Anda bias, model Anda juga akan.

lihat juga: http://handbook.cochrane.org/chapter_16/16_1_2_general_principles_for_dealing_with_missing_data.htm

dan:

Peringatan:

Setiap kali menggunakan shapefile, perlu diingat bahwa mereka tidak dapat menyimpan nilai nol. Alat atau prosedur lain yang membuat shapefile dari input nonshapefile dapat, akibatnya, menyimpan nilai null sebagai nol atau beberapa angka negatif yang sangat kecil (-DBL_MAX = -1.7976931348623158e + 308). Ini dapat menyebabkan hasil yang tidak terduga. Lihat juga: Pertimbangan geoproses untuk keluaran shapefile. ( http://desktop.arcgis.com/en/arcmap/10.3/tools/spatial-statistics-toolbox/geographically-weighted-regress.htm )

LMB
sumber