Distribusi sebelumnya apa yang bisa / harus digunakan untuk varians dalam model bayesisan hirarkis ketika varians rata-rata menarik?

16

Dalam makalahnya yang dikutip secara luas, distribusi Prior untuk parameter varians dalam model hierarkis (916 kutipan sejauh ini di Google Cendekia) Gelman mengusulkan bahwa distribusi sebelumnya yang tidak informatif untuk varian dalam model Bayesian hirarkis adalah distribusi seragam dan distribusi t setengah. Jika saya memahami hal-hal yang benar ini berfungsi dengan baik ketika itu adalah parameter lokasi (misalnya rata-rata) adalah kepentingan utama. Namun, kadang-kadang parameter varians menjadi perhatian utama, misalnya ketika menganalisis data respons manusia dari tugas waktu, berarti variabilitas waktu seringkali merupakan ukuran yang menarik. Dalam kasus-kasus itu, tidak jelas bagi saya bagaimana variabilitas dapat dimodelkan secara hierarkis dengan, misalnya, distribusi seragam, karena saya setelah analisis ingin mendapatkan kredibilitas varians rata-rata baik di tingkat peserta dan di tingkat kelompok.

Pertanyaan saya kemudian: Distribusi apa yang direkomendasikan ketika membangun model Bayesian hirarkis ketika varians data merupakan kepentingan utama?

Saya tahu bahwa distribusi gamma dapat direkam ulang untuk ditentukan oleh mean dan SD. Sebagai contoh, model hierarkis di bawah ini adalah dari buku Kruschke's Doing Bayesian Data Analysis . Tetapi Gelman menguraikan beberapa masalah dengan distribusi gamma dalam artikelnya dan saya akan berterima kasih atas saran alternatif, lebih disukai alternatif yang tidak sulit untuk bekerja di BUGS / JAGS.

masukkan deskripsi gambar di sini

Rasmus Bååth
sumber

Jawaban:

2

Saya tidak setuju dengan cara Anda menafsirkan Gelman tentang pilihan Gamma untuk parameter skala. Dasar pemodelan hierarkis adalah untuk menghubungkan parameter individu dengan yang umum melalui struktur dengan parameter yang tidak diketahui (biasanya rata-rata dan varians). Dalam pengertian ini, menggunakan distribusi gamma untuk varians individu (atau lognormal untuk ekor yang lebih berat) dikondisikan untuk varians rata-rata dan dispersinya tampak valid bagi saya (setidaknya berkaitan dengan argumen Gelman).

Para kritikus Gelman tentang gamma untuk parameter skala adalah tentang fakta bahwa gamma digunakan untuk mendekati Jeffrey dengan menetapkan nilai ekstrim ke parameternya. Masalahnya adalah bahwa tergantung pada seberapa ekstrem nilai-nilai ini (yang cukup sewenang-wenang) posterior mungkin sangat berbeda. Pengamatan ini membatalkan penggunaan sebelumnya ini, setidaknya ketika kita tidak memiliki informasi untuk ditetapkan di sebelumnya. Dalam diskusi itu, tampak bagi saya bahwa gamma atau invers-gamma tidak pernah dikalibrasi dalam hal mean dan varian dari informasi sebelumnya atau dari struktur hirarkis. Jadi rekomendasinya menyangkut konteks yang sangat berbeda dari Anda yang, jika saya mengerti tujuan Anda,

peuhp
sumber
0

Singkatnya, Gelman menguraikan masalah dalam menggunakan distribusi Gamma sebagai yang tidak jelas (ia menggunakan kata noninformatif ) untuk varian. Sebaliknya, masalah Anda (dan contoh Kruschke) tampaknya merujuk pada kasus di mana ada pengetahuan tentang varians. Juga perhatikan bahwa gambar distribusi variansτsaya tidak rata sama sekali.

altroware
sumber