Saya tertarik mempelajari cara mengembangkan perkiraan geografis semacam episentrum berdasarkan data dari wabah John Snow Cholera. Apa pemodelan statistik yang dapat digunakan untuk memecahkan masalah seperti itu tanpa pengetahuan sebelumnya tentang di mana sumur berada.
Sebagai masalah umum, Anda harus menyediakan waktu, lokasi titik yang diketahui, dan jalur berjalan pengamat. Metode yang saya cari akan menggunakan tiga hal ini untuk memperkirakan episentrum "wabah".
bayesian
spatial
epidemiology
gis
berambut pirang
sumber
sumber
Jawaban:
Bukan untuk memberikan jawaban yang lengkap atau otoritatif, tetapi hanya untuk merangsang ide, saya akan melaporkan analisis cepat yang saya buat untuk praktikum di kursus statistik spasial yang saya ajarkan sepuluh tahun yang lalu. Tujuannya adalah untuk melihat apa efek akuntansi yang akurat dari jalur perjalanan yang mungkin (berjalan kaki), dibandingkan dengan menggunakan jarak Euclidean, akan memiliki pada metode eksplorasi yang relatif sederhana: perkiraan kepadatan kernel. Di mana puncak (atau puncak) kepadatan relatif terhadap pompa yang pegangannya dilepas Snow?
Dengan menggunakan representasi raster beresolusi tinggi (2946 baris dengan 3160 kolom) dari peta Snow (di-georeferensi dengan tepat), saya mendigitalkan masing-masing dari ratusan peti mati hitam kecil yang ditampilkan di peta (menemukan 558 di antaranya di 309 alamat), menugaskan masing-masing untuk tepi jalan sesuai dengan alamatnya, dan meringkas berdasarkan alamat menjadi hitungan di setiap lokasi.
Setelah beberapa pemrosesan gambar untuk mengidentifikasi jalan-jalan dan gang-gang, saya melakukan difusi Gaussian sederhana terbatas pada daerah-daerah (menggunakan sarana fokus berulang dalam GIS). Ini adalah KDE.
Hasilnya berbicara sendiri - hampir tidak perlu legenda untuk menjelaskannya. (Peta menunjukkan banyak pompa lain, tetapi semuanya terletak di luar pandangan ini, yang berfokus pada area dengan kepadatan tertinggi.)
sumber
Dalam [1, §3.2], David Freedman menyarankan jawaban yang pada dasarnya negatif untuk pertanyaan Anda. Artinya, tidak ada (hanya) model statistik atau algoritma yang bisa menyelesaikan masalah John Snow. Masalah Snow adalah mengembangkan argumen kritis yang mendukung teorinya bahwa kolera adalah penyakit menular yang ditularkan melalui air, terhadap teori racun yang berlaku pada zamannya. (Bab 3 dalam [1], berjudul “Model Statistik dan Kulit Sepatu,” juga tersedia dalam bentuk yang diterbitkan sebelumnya [2] di sini .)
Dalam beberapa halaman pendek ini [1, hal.47–53], banyak di antaranya merupakan kutipan lanjutan dari John Snow sendiri, Freedman berpendapat bahwa "apa yang sebenarnya dilakukan Snow pada 1853–54 bahkan lebih menarik daripada dongeng [Broad] Street Pump]. " Sejauh membuat bukti statistik (pendahuluan lain seperti identifikasi kasus indeks, dll., Dibahas di samping), Snow mengeksploitasi variasi alami untuk menghasilkan eksperimen semu yang benar-benar luar biasa.
Ternyata pada waktu sebelumnya, ada persaingan ketat di antara perusahaan penyedia air di London, dan ini menghasilkan pencampuran spasial dari pasokan air yang (dalam kata-kata Snow) "dari jenis yang paling intim."
Bagian lain yang sangat penting dari 'variasi alami' yang dieksploitasi oleh John Snow dalam percobaan semu ini adalah bahwa satu perusahaan air memiliki asupan air di hilir Sungai Thames di hilir pembuangan limbah , sedangkan yang lainnya memiliki beberapa tahun sebelum memindahkan asupannya ke hulu . Saya akan membiarkan Anda menebak yang mana dari tabel data John Snow!
Sebagai Freedman mencatat dengan sedih,
Satu poin lebih lanjut dari variasi alami yang dieksploitasi oleh Snow terjadi dalam dimensi waktu : relokasi asupan air yang disebutkan di atas terjadi di antara dua epidemi, memungkinkan Snow untuk membandingkan air perusahaan yang sama dengan dan tanpa tambahan limbah. (Terima kasih kepada Philip B. Stark, salah satu penulis [1], untuk info ini melalui Twitter . Lihat kuliah online -nya.)
Hal ini juga memberikan studi instruktif dalam kontras antara deductivism dan inductivism , seperti yang dibahas dalam jawaban ini .
Freedman D, Collier D, Sekhon JS, Stark PB. Model Statistik dan Inferensial Kausal: Dialog dengan Ilmu Sosial. Cambridge; New York: Cambridge University Press; 2010
Freedman DA. Model Statistik dan Kulit Sepatu. Metodologi Sosiologis . 1991; 21: 291-313. doi: 10.2307 / 270939. Teks lengkap
sumber