Latar Belakang
Salah satu yang paling umum digunakan sebelum varian adalah invers-gamma dengan parameter (Gelman 2006) .
Namun, distribusi ini memiliki 90% CI sekitar .
library(pscl)
sapply(c(0.05, 0.95), function(x) qigamma(x, 0.001, 0.001))
[1] 3.362941e+19 Inf
Dari sini, saya menafsirkan bahwa memberikan probabilitas rendah bahwa varians akan sangat tinggi, dan probabilitas sangat rendah bahwa varians akan kurang dari 1 .
pigamma(1, 0.001, 0.001)
[1] 0.006312353
Pertanyaan
Apakah saya kehilangan sesuatu atau apakah ini benar-benar informasi yang informatif?
pembaruan untuk memperjelas, alasan saya mempertimbangkan ini 'informatif' adalah karena ia mengklaim sangat kuat bahwa varians sangat besar dan jauh melampaui skala hampir semua varian yang pernah diukur.
tindak lanjut akankah meta analisis sejumlah besar estimasi varians memberikan prioritas yang lebih masuk akal?
Referensi
Gelman 2006. Distribusi sebelumnya untuk parameter varians dalam model hierarkis . Analisis Bayesian 1 (3): 515–533
sumber
Jawaban:
Menggunakan distribusi gamma terbalik, kita mendapatkan:
Anda dapat melihat dengan mudah bahwa jika dan maka gamma terbalik akan mendekati Jeffreys sebelumnya. Distribusi ini disebut "tidak informatif" karena merupakan perkiraan yang tepat untuk Jeffrey sebelumnyaβ→0 α→0
Sebagai contoh , yang tidak informatif untuk parameter skala, lihat halaman 18 di sini , karena sebelumnya ini adalah satu-satunya yang tetap berubah di bawah perubahan skala (perhatikan bahwa perkiraannya tidak invarian). Ini memiliki integral yang tidak terbatas yang menunjukkan bahwa tidak tepat jika kisaran termasuk atau . Tetapi kasus-kasus ini hanya masalah dalam matematika - bukan di dunia nyata. Jangan pernah benar-benar mengamati nilai tak terbatas untuk varian, dan jika varian yang diamati adalah nol, Anda memiliki data sempurna !. Untuk Anda dapat menetapkan batas bawah sama dengan dan batas atas sama dengan , dan distribusi Anda tepat.log(σ2) σ2 0 ∞ L>0 U<∞
Walaupun mungkin tampak aneh bahwa ini "tidak informatif" karena lebih suka varian kecil daripada besar, tetapi ini hanya dalam satu skala. Anda dapat menunjukkan bahwa memiliki distribusi seragam yang tidak tepat. Jadi ini sebelumnya tidak mendukung satu skala lebih dari yang lainlog(σ2)
Meskipun tidak terkait langsung dengan pertanyaan Anda, saya akan menyarankan distribusi non-informatif "lebih baik" dengan memilih batas atas dan bawah dan di Jeffreys sebelum daripada dan . Biasanya batas dapat diatur cukup mudah dengan sedikit pemikiran untuk apa sebenarnya berarti di dunia nyata. Jika itu adalah kesalahan dalam beberapa jenis kuantitas fisik - tidak boleh lebih kecil dari ukuran atom, atau ukuran terkecil yang dapat Anda amati dalam percobaan Anda. LanjutL U α β σ2 L U tidak bisa lebih besar dari bumi (atau matahari jika Anda ingin benar-benar konservatif). Dengan cara ini Anda menjaga properti invarian Anda, dan yang lebih mudah sebelum sampel dari: ambil , lalu nilai simulasi sebagai .q(b)∼Uniform(log(L),log(U)) σ2(b)=exp(q(b))
sumber
Cukup dekat dengan flat. Mediannya adalah 1.9 E298, hampir nomor satu terbesar dapat mewakili dalam aritmatika mengambang presisi ganda. Seperti yang Anda tunjukkan, probabilitas yang diberikannya pada interval apa pun yang tidak terlalu besar benar-benar kecil. Sulit mendapatkan informasi yang kurang dari itu!
sumber