Masalah
Saya menulis fungsi R yang melakukan analisis Bayesian untuk memperkirakan kepadatan posterior yang diberikan informasi sebelumnya dan data. Saya ingin fungsi mengirim peringatan jika pengguna perlu mempertimbangkan kembali sebelumnya.
Dalam pertanyaan ini, saya tertarik mempelajari cara mengevaluasi pendahuluan. Pertanyaan-pertanyaan sebelumnya telah membahas mekanisme menyatakan prior informasi (di sini dan di sini .)
Kasus-kasus berikut mungkin mengharuskan yang sebelumnya dievaluasi kembali:
- data merupakan kasus ekstrem yang tidak diperhitungkan saat menyatakan sebelumnya
- kesalahan dalam data (mis. jika data dalam satuan g ketika prior dalam kg)
- prior yang salah dipilih dari serangkaian prior yang tersedia karena bug dalam kode
Dalam kasus pertama, prior biasanya masih cukup menyebar sehingga data umumnya akan membanjiri mereka kecuali nilai data berada dalam kisaran yang tidak didukung (mis. <0 untuk logN atau Gamma). Kasus lainnya adalah bug atau kesalahan.
Pertanyaan
- Apakah ada masalah tentang validitas menggunakan data untuk mengevaluasi prior?
- apakah ada tes khusus yang paling cocok untuk masalah ini?
Contohnya
Data biru bisa menjadi kombinasi + data sebelumnya yang valid sedangkan data merah akan membutuhkan distribusi sebelumnya yang didukung untuk nilai negatif.
set.seed(1)
x<- seq(0.01,15,by=0.1)
plot(x, dlnorm(x), type = 'l', xlim = c(-15,15),xlab='',ylab='')
points(rnorm(50,0,5),jitter(rep(0,50),factor =0.2), cex = 0.3, col = 'red')
points(rnorm(50,8,0.5),jitter(rep(0,50),factor =0.4), cex = 0.3, col = 'blue')
sumber
Di sini dua sen saya:
Saya pikir Anda harus khawatir tentang parameter over sebelum yang terkait dengan rasio.
Anda berbicara tentang sebelumnya yang informatif, tetapi saya pikir Anda harus memperingatkan pengguna tentang apa yang sebelumnya tidak masuk akal dan masuk akal. Maksudku, kadang-kadang normal dengan nol rata-rata dan 100 varian cukup tidak informatif dan kadang-kadang informatif, tergantung dari skala yang digunakan. Misalnya, jika Anda mengalami kemunduran upah pada ketinggian (sentimeter) dari sebelumnya di atas cukup informatif. Namun, jika Anda melakukan regresi upah log pada ketinggian (meter), maka sebelum di atas tidak informatif.
Jika Anda menggunakan prior yang merupakan hasil dari analisis sebelumnya, yaitu, prior baru sebenarnya adalah posteriori lama dari analisis sebelumnya, maka semuanya berbeda. Saya berasumsi ini adalah catatan kasusnya.
sumber