Dalam Bayesian Data Analysis , bab 13, halaman 317, paragraf penuh kedua, dalam pendekatan modal dan distribusi, Gelman et al. menulis:
Jika rencananya adalah untuk meringkas inferensi dengan mode posterior [parameter korelasi dalam distribusi normal bivariat], kita akan mengganti distribusi U (-1,1) sebelumnya dengan , yang setara dengan Beta (2,2) pada parameter yang diubah . Kepadatan sebelumnya dan yang dihasilkan adalah nol pada batas dan dengan demikian mode posterior tidak akan pernah menjadi -1 atau 1. Namun, ... kepadatan sebelumnya untuk adalah linier di dekat batas dan dengan demikian tidak akan bertentangan dengan kemungkinan apa pun.
Di bawah ini adalah plot PDF untuk distribusi Beta (2,2).
Meskipun plot diberikan untuk domain [0,1], bentuknya sama untuk domain [-1,1] yang diperoleh dengan melakukan kebalikan dari transformasi yang dijelaskan dalam kutipan di atas. Ini adalah distribusi yang cukup informatif! Ini memberikan sekitar tujuh kali kepadatan untuk daripada yang dilakukannya untuk . Jadi sebenarnya itu akan bertentangan dengan kemungkinan jika kemungkinan menunjuk ke sesuatu yang jauh dari batas, tetapi lebih jauh dari . Bukankah batas yang lebih baik untuk menghindari sebelumnya adalah Beta (1 + , 1 + ), di mana . Ambil, misalnya, Beta (1.0001, 1.0001), diplot di bawah ini:
Masalahnya dengan ini sebelumnya, tentu saja, adalah bahwa kepadatan turun sangat tajam mendekati nol, yang dapat bertentangan dengan kemungkinan itu menunjuk ke ruang yang sangat sangat dekat dengan batas. Yang membawa saya ke pertanyaan saya:
Mengapa tidak mengatur sebelumnya parameter korelasi yang diubah menjadi Beta (1,1)? Karena kepadatan distribusi beta adalah nol untuk , ini setara dengan distribusi seragam selama interval terbuka (-1,1) daripada interval tertutup [-1, 1], dan apakah itu bukan batas yang menghindari sebelumnya, dan apakah itu tidak lebih disukai daripada sebelumnya yang menempatkan kepercayaan yang cukup kuat pada probabilitas bahwa , yang hanya diinginkan jika Anda benar-benar memiliki keyakinan itu?
Secara umum, bukankah menggunakan distribusi beta dengan definisi sebagai penghindaran batas sebelumnya karena dukungannya adalah ?