Anda mungkin pernah mendengar tentang wabah E. coli
( EHEC )
enterohaemorrhagic baru-baru ini di Jerman .
Pertanyaan apa yang akan diajukan ahli statistik tentang analisis EHEC?
Saya sedang memikirkan Q + As antara wartawan / pejabat publik ↔ non-ahli, katakanlah guru dan insinyur dengan gelar Diplom / Master tetapi paling tidak segelintir statistik.
(Apakah gambar, peta tanah EHEC yang menunjukkan berbagai galur EHEC dan cakupan berbagai tes, mungkin?)
Senin 20 Juni: Saya pikir wabah EHEC akan menjadi area di mana statistik benar-benar penting di dunia pada umumnya: apa bukti untuk berbagai penyebab, bagaimana ini bisa dikomunikasikan kepada publik? Jadi, memulai karunia.
data-visualization
teaching
denis
sumber
sumber
Jawaban:
Jika Anda tidak memiliki pertanyaan ilmiah apriori yang Anda inginkan / perlu dijawab - saya akan melihat distribusi spasial kasus. Secara khusus, saya akan memperkirakan semacam fungsi "intensitas" spasial - yaitu beberapa fungsi . Agar Anda tidak menyesuaikan data, beberapa penghalusan akan sesuai, yang secara efektif akan "bin" lokasi terdekat bersama-sama. Pendekatan paling sederhana akan menggunakan fungsi estimasi kepadatan kernel (misalnya fungsi kde2d di R, meskipun beberapa pra-pemrosesan data mungkin diperlukan). Ini akan membantu mengidentifikasi "hot spot" dalam distribusi spasial dan dapat mengarahkan seorang penyelidik untuk mengidentifikasi reservoir lingkungan E. Coli.f(s)=E(prevalence| you are in location s)
Bergantung pada data apa yang Anda miliki, model spasial yang lebih canggih yang menyesuaikan pembaur yang diketahui dapat digunakan.
sumber