Aku baru saja mulai membangun model di stan ; untuk membangun keakraban dengan alat ini, saya sedang mengerjakan beberapa latihan di Bayesian Data Analysis (2nd ed.). The Waterbuck latihan mengandaikan bahwa data , dengan ( N , θ ) tidak diketahui. Karena Hamiltonian Monte Carlo tidak mengizinkan parameter diskrit, saya telah mendeklarasikan N sebagai ∈ [ 72 , ∞ ) dan mengkodekan distribusi binomial bernilai nyata menggunakan fungsi tersebut.lbeta
Histogram hasil terlihat hampir identik dengan apa yang saya temukan dengan menghitung kepadatan posterior secara langsung. Namun, saya khawatir bahwa mungkin ada beberapa alasan halus bahwa saya tidak boleh mempercayai hasil ini secara umum; karena inferensi bernilai nyata pada memberikan probabilitas positif ke nilai-nilai non-integer, kita tahu bahwa nilai-nilai ini tidak mungkin, karena waterbuck fraksional tidak ada dalam kenyataan. Di sisi lain, hasilnya tampak baik-baik saja, sehingga penyederhanaan tampaknya tidak berpengaruh pada kesimpulan dalam kasus ini.
Apakah ada prinsip atau aturan praktis untuk pemodelan dengan cara ini, atau apakah metode "mempromosikan" parameter terpisah ini menjadi praktik buruk yang nyata?
sumber
Jawaban:
Pertama, jangan ragu untuk mengajukan pertanyaan seperti ini di daftar pengguna kami ( http://mc-stan.org/mailing-lists.html ) di mana kami membahas tidak hanya masalah yang terkait dengan implementasi Stan / optimisasi / dll tetapi juga statistik praktis dan pertanyaan pemodelan.
Mengenai pertanyaan Anda, ini benar-benar pendekatan yang bagus. Ada banyak cara untuk membenarkannya dengan lebih ketat (misalnya, melihat perbedaan antara CDF diskrit dan perkiraan kontinyu) tetapi pada dasarnya selama varians Anda lebih besar dari beberapa kali kesatuan maka diskritisasi yang hilang tidak akan benar-benar memiliki berpengaruh pada kesimpulan berikutnya.
Jenis pendekatan ini ada di mana-mana, contoh umum adalah perkiraan distribusi multinomial sebagai produk dari distribusi Poisson independen yang kemudian didekati sebagai distribusi Gaussian.
sumber