Apa analogi yang baik untuk menggambarkan kekuatan Model Bayesian Hierarchical?

10

Saya relatif baru untuk statistik bayesian dan telah menggunakan JAGS baru-baru ini untuk membangun model bayesian hirarkis pada dataset yang berbeda. Sementara saya sangat puas dengan hasilnya (dibandingkan dengan model glm standar), saya perlu menjelaskan kepada non-statistik apa perbedaan dengan model statistik standar. Terutama, saya ingin menggambarkan mengapa dan kapan HBM berkinerja lebih baik daripada model yang lebih sederhana.

Analogi akan bermanfaat, terutama yang menggambarkan beberapa elemen kunci:

  • berbagai tingkat heterogenitas
  • kebutuhan akan lebih banyak perhitungan agar sesuai dengan model
  • kemampuan untuk mengekstrak lebih banyak "sinyal" dari data yang sama

Perhatikan bahwa jawabannya harus benar-benar analogi yang mencerahkan kepada orang-orang yang tidak memiliki statistik, bukan contoh yang mudah dan baik untuk diikuti.

nassimhddd
sumber
4
Masalah klasik "delapan sekolah" tampaknya seperti kandidat yang hebat untuk memperkenalkan HBM. andrewgelman.com/2014/01/21/…
Sycorax mengatakan
2
@ cafe876. Saya tidak melihat bagaimana sifat pemodelan Bayesian khusus untuk poin Anda. Apakah pertanyaan Anda benar-benar spesifik untuk model hierarkis Bayesian? atau hanya untuk model hierarkis?
peuhp
@ euhp dari pengalaman saya, kerangka bayesian memungkinkan estimasi model yang jauh lebih kompleks.
nassimhddd

Jawaban:

3

Saya ingin menggambarkan contoh pemodelan yang berkaitan dengan tingkat kanker (Seperti dalam Johnson dan Albert 1999). Ini akan menyentuh elemen pertama dan ketiga dari minat Anda.
Jadi masalahnya adalah memprediksi tingkat kanker di berbagai kota. Katakanlah kita memiliki data jumlah orang di berbagai kota dan jumlah orang yang meninggal karena kanker . Katakanlah kita ingin memperkirakan tingkat kanker . Ada berbagai cara untuk memodelkan mereka dan ketika kita melihat masalah dengan masing-masing. Kita akan melihat bagaimana pemodelan heirachical bayes dapat mengatasi beberapa masalah. 1. Salah satu caranya adalah dengan melakukan estimasi secara terpisah tetapi kita akan menderita masalah data yang jarang dan akan meremehkan tarif sebagaimana rendah .Nixiθi
Ni
2. Satu lagi pendekatan untuk mengelola masalah data jarang adalah menggunakan sama untuk semua kota dan mengikat parameter tetapi ini juga merupakan asumsi yang sangat kuat. 3. Jadi yang bisa dilakukan adalah semua mirip dalam beberapa hal tetapi juga dengan variasi spesifik kota. Jadi kita bisa memodelkan sedemikian rupa sehingga semua diambil dari distribusi umum. Katakanlah dan Distribusi gabungan penuh akan menjadi mana . Kita perlu menyimpulkanθi
θiθixiBin(Ni,θi)θiBeta(a,b)
η = ( a , b ) η θ i η θ ip(D,θ,η|N)=p(η)i=1NBin(xi|Ni,θi)Beta(θi|η)η=(a,b)ηdari data. Jika dijepit ke konstanta maka informasi tidak akan mengalir antara dan mereka akan independen secara kondisional. Tetapi dengan memperlakukan sebagai tidak diketahui, kami mengizinkan kota-kota dengan data yang lebih sedikit meminjam kekuatan statistik dari kota-kota dengan lebih banyak data. Gagasan utamanya adalah untuk lebih bayesian dan menetapkan prior pada prior untuk memodelkan ketidakpastian dalam hiperparameter. Ini memungkinkan aliran pengaruh antara dalam contoh ini.θiη
θi

dksahuji
sumber
Terima kasih, ini adalah contoh yang sangat bagus, namun ini bukan analogi. Saya benar-benar mencari sesuatu yang bisa saya jelaskan kepada non-ahli statistik.
nassimhddd
Saya kira berbagi dan variasi pada tingkat yang berbeda dapat digunakan untuk non statistik.
dksahuji
itu benar, tetapi tidakkah ada cerita yang lebih sederhana untuk menggambarkan hal ini?
nassimhddd
3

Ketika Anda sakit, Anda mengamati gejala tetapi yang Anda inginkan adalah diagnosis. Jika Anda bukan seorang dokter, saya kira Anda hanya dapat menemukan diagnosis yang paling cocok dengan gejala Anda. Tapi apa yang akan dilakukan Ph HBM adalah untuk melihat gejala Anda, keberartian relatifnya, bagaimana mereka cocok / menghubungkan berbagai masalah kesehatan Anda sebelumnya, salah satu keluarga Anda, penyakit umum saat ini dan kondisi lingkungan, kelemahan Anda, kekuatan Anda ... dan kemudian dia akan menggabungkan barang-barang ini menggunakan pengetahuannya untuk memperbarui apa yang dia kira dari kondisi kesehatan Anda dan akan memberi Anda diagnosis yang lebih mungkin.

Saya yakin analogi ini mencapai batasnya segera tetapi saya pikir analogi ini dapat memberikan intuisi yang baik tentang apa yang diharapkan seseorang dari HBM, bukan? (dan saya tidak menemukan yang lebih baik)

peuhp
sumber
Saya suka analogi itu! Mungkin menyempurnakannya sedikit dengan menambahkan yang dapat menambahkan bahwa beberapa gejala lebih bermakna untuk kesimpulan potensial tertentu (hasil tes darah) daripada yang lain (kadang-kadang betis kiri saya sedikit sakit)
MikeP
Contoh yang bagus ... di mana saya pikir itu gagal adalah bahwa tampaknya menyiratkan bahwa kekuatan HBM terletak pada akses ke informasi LEBIH BANYAK (sejarah, keluarga, dll.); sementara saya ingin menyatakan bahwa HBM lebih canggih dengan informasi SAMA. Apakah ada cara untuk menyesuaikan cerita Anda?
nassimhddd
@ cafe876. Thks, izinkan saya sedikit waktu untuk memikirkannya.
peuhp