Saya memiliki masalah analisis keputusan yang agak rumit yang melibatkan pengujian reliabilitas dan pendekatan logis (bagi saya) tampaknya melibatkan penggunaan MCMC untuk mendukung analisis Bayesian. Namun, telah disarankan bahwa akan lebih tepat untuk menggunakan pendekatan bootstrap. Bisakah seseorang menyarankan referensi (atau tiga) yang mungkin mendukung penggunaan salah satu teknik di atas yang lain (bahkan untuk situasi tertentu)? FWIW, saya memiliki data dari banyak sumber yang berbeda dan sedikit / nol pengamatan kegagalan. Saya juga punya data di tingkat subsistem dan sistem.
Sepertinya perbandingan seperti ini harus tersedia, tetapi saya tidak beruntung mencari tersangka biasa. Terima kasih sebelumnya untuk petunjuk apa pun.
Jawaban:
Menurut saya, uraian masalah Anda menunjukkan dua masalah utama. Pertama:
Dengan asumsi Anda memiliki fungsi kerugian di tangan, Anda perlu memutuskan apakah Anda peduli dengan risiko yang sering terjadi atau kehilangan yang diperkirakan terjadi di belakang . Bootstrap memungkinkan Anda memperkirakan fungsional dari distribusi data, sehingga ini akan membantu dengan yang sebelumnya; dan sampel posterior dari MCMC akan memungkinkan Anda menilai yang terakhir. Tapi...
jadi data ini memiliki struktur hierarkis. Pendekatan Bayes memodelkan data seperti itu dengan sangat alami, sedangkan bootstrap pada awalnya dirancang untuk data yang dimodelkan sebagai iid. Meskipun telah diperluas ke data hierarkis (lihat referensi dalam pengantar makalah ini ), pendekatan tersebut relatif kurang berkembang (menurut abstrak dari artikel ini ).
Untuk meringkas: jika benar-benar merupakan risiko yang sering Anda pedulikan, maka beberapa penelitian awal dalam penerapan bootstrap ke teori keputusan mungkin diperlukan. Namun, jika meminimalkan kerugian yang diperkirakan posterior lebih cocok alami untuk masalah keputusan Anda, Bayes pasti cara untuk pergi.
sumber
Saya telah membaca bahwa bootstrap non-parametrik dapat dilihat sebagai kasus khusus model Bayesian dengan diskrit (sangat) tidak informatif sebelumnya, di mana asumsi yang dibuat dalam model adalah bahwa data tersebut diskrit, dan domain dari distribusi target Anda sepenuhnya diamati dalam sampel Anda.
Berikut adalah dua referensi:
sumber