Untuk masalah regresi logistik Bayesian, saya telah membuat distribusi prediksi posterior. Saya sampel dari distribusi prediktif dan menerima ribuan sampel (0,1) untuk setiap pengamatan yang saya miliki. Memvisualisasikan kebaikan tidak terlalu menarik, misalnya:
Plot ini menunjukkan 10 000 sampel + titik datum yang diamati (cara di sebelah kiri dapat melihat garis merah: ya itulah pengamatan). Masalahnya adalah plot ini hampir tidak informatif, dan saya akan memiliki 23 di antaranya, satu untuk setiap titik data.
Apakah ada cara yang lebih baik untuk memvisualisasikan 23 titik data ditambah sampel posterior.
Upaya lain:
Upaya lain berdasarkan pada makalah di sini
bayesian
data-visualization
classification
goodness-of-fit
binary-data
Cam.Davidson.Pilon
sumber
sumber
Jawaban:
Saya merasa Anda tidak cukup menyerahkan semua barang untuk situasi Anda, tetapi mengingat apa yang kami miliki di depan kami mari kita pertimbangkan kegunaan dot-plot sederhana untuk menampilkan informasi.
Satu-satunya hal nyata untuk tidak ada di sini (yang mungkin bukan perilaku standar) adalah:
Sortasi adalah kicker nyata untuk dot-plot seperti ini. Menyortir berdasarkan nilai proporsi di sini membantu dengan mudah mengungkap pengamatan residu yang tinggi. Memiliki sistem di mana Anda dapat dengan mudah mengurutkan berdasarkan nilai-nilai yang terkandung dalam plot atau dalam karakteristik eksternal dari kasing adalah cara terbaik untuk mendapatkan keuntungan.
Nasihat ini meluas ke pengamatan berkelanjutan juga. Anda bisa mewarnai / membentuk titik sesuai dengan apakah residu negatif atau positif, dan kemudian ukuran titik sesuai dengan residu absolut (atau kuadrat). Ini IMO tidak diperlukan di sini karena kesederhanaan nilai-nilai yang diamati.
sumber
Cara yang biasa untuk memvisualisasikan kecocokan model regresi logistik Bayesian dengan satu prediktor adalah dengan merencanakan distribusi prediktif bersama dengan proporsi yang sesuai. (Tolong, beri tahu saya jika saya mengerti pertanyaan Anda)
Contoh menggunakan kumpulan data Bliss yang populer.
Kode di bawah ini dalam R:
sumber
ni = 23
danno = 7
dan masing-masing 23 individu memiliki yang berbeda satudose
. Anda bisa membuat plot serupa untuk data OP, (poin ditempatkan pada 0 atau 1 pada sumbu Y, dan Anda plot fungsinya). Lihat beberapa contoh plot serupa untuk regresi logistik dalam referensi yang saya berikan pada jawaban ini .Saya menanggapi permintaan untuk teknik grafis alternatif yang menunjukkan seberapa baik peristiwa kegagalan yang disimulasikan cocok dengan peristiwa kegagalan yang diamati. Pertanyaan muncul dalam "Pemrograman Probabilistik dan Metode Bayesian untuk Peretas" ditemukan di sini . Inilah pendekatan grafis saya:
Kode ditemukan di sini .
sumber