Saya relatif baru untuk statistik bayesian dan telah menggunakan JAGS baru-baru ini untuk membangun model bayesian hirarkis pada dataset yang berbeda. Sementara saya sangat puas dengan hasilnya (dibandingkan dengan model glm standar), saya perlu menjelaskan kepada non-statistik apa perbedaan dengan model statistik standar. Terutama, saya ingin menggambarkan mengapa dan kapan HBM berkinerja lebih baik daripada model yang lebih sederhana.
Analogi akan bermanfaat, terutama yang menggambarkan beberapa elemen kunci:
- berbagai tingkat heterogenitas
- kebutuhan akan lebih banyak perhitungan agar sesuai dengan model
- kemampuan untuk mengekstrak lebih banyak "sinyal" dari data yang sama
Perhatikan bahwa jawabannya harus benar-benar analogi yang mencerahkan kepada orang-orang yang tidak memiliki statistik, bukan contoh yang mudah dan baik untuk diikuti.
bayesian
hierarchical-bayesian
nassimhddd
sumber
sumber
Jawaban:
Saya ingin menggambarkan contoh pemodelan yang berkaitan dengan tingkat kanker (Seperti dalam Johnson dan Albert 1999). Ini akan menyentuh elemen pertama dan ketiga dari minat Anda.Ni xi θi
Ni θi
θi θi xi∼Bin(Ni,θi) θi∼Beta(a,b) p(D,θ,η|N)=p(η)∏Ni=1Bin(xi|Ni,θi)Beta(θi|η) η=(a,b) η dari data. Jika dijepit ke konstanta maka informasi tidak akan mengalir antara dan mereka akan independen secara kondisional. Tetapi dengan memperlakukan sebagai tidak diketahui, kami mengizinkan kota-kota dengan data yang lebih sedikit meminjam kekuatan statistik dari kota-kota dengan lebih banyak data.
Gagasan utamanya adalah untuk lebih bayesian dan menetapkan prior pada prior untuk memodelkan ketidakpastian dalam hiperparameter. Ini memungkinkan aliran pengaruh antara dalam contoh ini.θi η
θi
Jadi masalahnya adalah memprediksi tingkat kanker di berbagai kota. Katakanlah kita memiliki data jumlah orang di berbagai kota dan jumlah orang yang meninggal karena kanker . Katakanlah kita ingin memperkirakan tingkat kanker . Ada berbagai cara untuk memodelkan mereka dan ketika kita melihat masalah dengan masing-masing. Kita akan melihat bagaimana pemodelan heirachical bayes dapat mengatasi beberapa masalah. 1. Salah satu caranya adalah dengan melakukan estimasi secara terpisah tetapi kita akan menderita masalah data yang jarang dan akan meremehkan tarif sebagaimana rendah .
2. Satu lagi pendekatan untuk mengelola masalah data jarang adalah menggunakan sama untuk semua kota dan mengikat parameter tetapi ini juga merupakan asumsi yang sangat kuat. 3. Jadi yang bisa dilakukan adalah semua mirip dalam beberapa hal tetapi juga dengan variasi spesifik kota. Jadi kita bisa memodelkan sedemikian rupa sehingga semua diambil dari distribusi umum. Katakanlah dan Distribusi gabungan penuh akan menjadi mana . Kita perlu menyimpulkan
η = ( a , b ) η θ i η θ i
sumber
Ketika Anda sakit, Anda mengamati gejala tetapi yang Anda inginkan adalah diagnosis. Jika Anda bukan seorang dokter, saya kira Anda hanya dapat menemukan diagnosis yang paling cocok dengan gejala Anda. Tapi apa yang akan dilakukan Ph HBM adalah untuk melihat gejala Anda, keberartian relatifnya, bagaimana mereka cocok / menghubungkan berbagai masalah kesehatan Anda sebelumnya, salah satu keluarga Anda, penyakit umum saat ini dan kondisi lingkungan, kelemahan Anda, kekuatan Anda ... dan kemudian dia akan menggabungkan barang-barang ini menggunakan pengetahuannya untuk memperbarui apa yang dia kira dari kondisi kesehatan Anda dan akan memberi Anda diagnosis yang lebih mungkin.
Saya yakin analogi ini mencapai batasnya segera tetapi saya pikir analogi ini dapat memberikan intuisi yang baik tentang apa yang diharapkan seseorang dari HBM, bukan? (dan saya tidak menemukan yang lebih baik)
sumber