Mengapa seorang Bayesian tidak diizinkan untuk melihat residunya?

46

Dalam artikel "Diskusi: Haruskah Ekolog Menjadi Bayesians?" Brian Dennis memberikan pandangan yang mengejutkan dan positif dari statistik Bayesian ketika tujuannya tampaknya untuk memperingatkan orang tentang hal itu. Namun, dalam satu paragraf, tanpa kutipan atau justifikasi, ia mengatakan:

Bayesians, Anda lihat, tidak diizinkan untuk melihat residu mereka. Itu melanggar prinsip kemungkinan untuk menilai suatu hasil dengan seberapa ekstremnya itu di bawah model. Bagi seorang Bayesian, tidak ada model yang buruk, hanya keyakinan buruk.

Mengapa seorang Bayesian tidak diizinkan untuk melihat residunya? Apa kutipan yang sesuai untuk ini (yaitu siapa yang ia kutip)?

Dennis, B.
Diskusi: Haruskah Ekolog Menjadi Bayesians?
Aplikasi Ekologis, Masyarakat Ekologis Amerika , 1996 , 6, 1095-1103

Mankka
sumber
6
Jika argumen itu berhasil, frequentist juga tidak dapat menggunakan prinsip kemungkinan - untuk alasan yang sama.
Glen_b
@Glen: Analisis frekuensi tidak melanggar prinsip kemungkinan.
Scortchi
3
@Glen: Sebuah frequentist benar-benar terikat pada LP (versi lemah, setara dengan Prinsip Kecukupan - versi yang kuat hanya kompatibel dengan pendekatan frequentist) akan memiliki model shun pemeriksaan. Orang-orang yang hanya mengaguminya senang ketika mereka dapat menggunakannya untuk pekerjaan memperkirakan parameter dari model tertentu & masih memiliki lebih atau kurang pendukung independen - residu - yang tersisa untuk model memeriksa setiap cara lama.
Scortchi
1
Bahkan ketika sering melakukan estimasi ML, dia masih melanggar LP karena dia menganggap distribusi sampling dari MLE untuk menemukan interval kepercayaan untuk estimasi nya.
Zen
2
@ Zen: Dia tidak melanggar LP yang lemah selama interval kepercayaan tergantung pada data hanya melalui fungsi kemungkinan. Tapi dia cepat atau lambat akan melanggar LP yang kuat dengan membuat interval kepercayaan yang berbeda berdasarkan fungsi kemungkinan yang sama dari percobaan yang berbeda dengan ruang pengambilan sampel yang berbeda.
Scortchi

Jawaban:

19

Tentu saja orang Bayes dapat melihat residunya! Dan tentu saja ada model buruk dalam analisis Bayesian. Mungkin beberapa orang Bayesian di tahun 70-an mendukung pandangan seperti itu (dan saya ragu itu), tetapi Anda tidak akan menemukan orang Bayesian yang mendukung pandangan ini akhir-akhir ini.

Saya tidak membaca teks, tetapi orang Bayesian menggunakan hal-hal seperti faktor Bayes untuk membandingkan model. Sebenarnya, seorang Bayesian bahkan dapat menghitung probabilitas model menjadi benar dan memilih model yang lebih mungkin benar. Atau Bayesian dapat rata-rata di seluruh model, untuk mencapai model yang lebih baik. Atau dapat menggunakan pemeriksaan prediktif posterior. Ada banyak pilihan untuk memeriksa suatu model dan masing-masing dapat mendukung satu pendekatan atau yang lain, tetapi untuk mengatakan bahwa tidak ada model yang buruk dalam analisis Bayesian adalah tidak masuk akal.

Jadi, paling banyak, akan lebih tepat untuk mengatakan bahwa dalam beberapa versi ekstrim Bayesianisme (versi ekstrem yang hampir tidak ada yang menggunakan pengaturan, Anda tidak diperbolehkan memeriksa model Anda. Tapi daripada yang bisa Anda katakan bahwa dalam beberapa versi ekstrim frekuensi Anda tidak diperbolehkan menggunakan data pengamatan juga. Tetapi mengapa membuang-buang waktu membahas hal-hal konyol ini, ketika kita dapat mendiskusikan jika dan kapan, dalam lingkungan terapan, kita harus menggunakan metode Bayesian atau sering atau apa pun? Itulah yang penting, menurut saya.

Pembaruan: OP meminta referensi seseorang yang menganjurkan versi ekstrim Bayes. Karena saya tidak pernah membaca versi ekstrim Bayes, saya tidak dapat memberikan referensi ini. Tapi saya kira Savage mungkin referensi seperti itu. Saya tidak pernah membaca apa pun yang ditulis olehnya, jadi saya mungkin salah.

ps .: Pikirkan tentang masalah "Bayesian yang dikalibrasi dengan baik" ( Dawid (1982), JASA , 77 , 379 ). Peramal Bayesian yang subyekti koheren tidak dapat tidak dikalibrasi, dan karenanya tidak akan meninjau model / ramalannya meskipun ada banyak bukti bahwa ia tidak dikalibrasi. Tapi saya tidak berpikir siapa pun dalam praktiknya dapat mengklaim sebagai yang koheren. Jadi, tinjauan model penting.

ps2 .: Saya suka makalah ini dari Efron juga. Referensi lengkapnya adalah: Efron, Bradley (2005). "Bayesians, frequentist, dan ilmuwan." Jurnal Asosiasi Statistik Amerika 100 (469).

Manoel Galdino
sumber
5
Saya juga berasumsi bahwa larangan itu tidak pernah dianggap serius dalam praktik, jadi saya terkejut membaca ini dari Gelman: - "Saya tentu tidak ingin kembali ke status quo sekitar tahun 1990 dalam statistik Bayesian, di mana itu dianggap hampir ilegal untuk memeriksa kecocokan model Anda dengan data. "
Scortchi
1
Saya tidak tahu bagaimana statistik Bayesian di tahun sembilan puluhan. Tetapi sulit untuk percaya bahwa dalam pengaturan yang diterapkan Bayesians tidak memeriksa model mereka. Mungkin mereka memeriksa, tetapi tidak memberi tahu!
Manoel Galdino
2
Saya pasti setuju bahwa ini bukan masalah besar, saya hanya ingin tahu apakah ada yang menerbitkan ini. Pernahkah Anda membaca seseorang yang menganjurkan "versi ekstrim Bayesianisme" ini?
Mankka
35

Mereka bisa melihat tetapi tidak menyentuh. Bagaimanapun, residu adalah bagian dari data yang tidak membawa informasi apa pun tentang parameter model, dan sebelumnya mereka menyatakan semua ketidakpastian tentang hal itu — mereka tidak dapat mengubah prioritasnya berdasarkan apa yang mereka lihat dalam data.

Sebagai contoh, misalkan Anda memasang model Gaussian, tetapi perhatikan terlalu banyak kurtosis pada residu. Mungkin hipotesis Anda sebelumnya seharusnya adalah distribusi-t dengan probabilitas non-nol di atas derajat kebebasan yang rendah, tetapi ternyata tidak — itu adalah distribusi-t secara efektif dengan probabilitas nol di mana-mana kecuali pada derajat kebebasan tanpa batas. Tidak ada dalam kemungkinan dapat menghasilkan probabilitas non-nol atas wilayah kepadatan posterior di mana kepadatan sebelumnya adalah nol. Jadi gagasan untuk terus memperbarui prior berdasarkan kemungkinan dari data tidak berfungsi ketika yang asli sebelumnya salah ditentukan.

Tentu saja jika Anda Google "memeriksa model Bayesian", Anda akan melihat ini adalah parodi dari praktik Bayesian yang sebenarnya; tetap saja, itu memang merepresentasikan sesuatu yang sulit bagi argumen Logika Ilmu Pengetahuan - jenis keunggulan superioritas Bayesianisme atas dasar filosofis. Blog Andrew Gelman menarik pada topik ini.

Scortchi - Reinstate Monica
sumber
Apakah Anda punya referensi tentang "kesulitan Logika Ilmu Pengetahuan" ini?
Mankka
7
Saya merujuk pada Jaynes, Teori Probabilitas: Logika Ilmu Pengetahuan , di mana penggunaan berulang teorema Bayes untuk memperbarui distribusi probabilitas ketika data baru masuk diklaim sebagai paradigma untuk pertumbuhan pengetahuan ilmiah. Saya yakin dia berurusan dengan masalah prior yang terlalu sempit, tapi saya tidak ingat bagaimana, atau seberapa memuaskan. Dan saya akan mengubah "superioritas umum" menjadi "superioritas atas dasar filosofis", karena itu tampaknya lebih baik menyampaikan apa yang saya maksudkan.
Scortchi
Ini contoh dari Bayesian penggunaan sebelum diaplikasikan untuk mengurangi sesekali (2%) terjadinya unphysical hasil. Kurangnya fisik telah dikaitkan dengan pencampuran instan non-fisik (obat dalam tubuh) dan diperbaiki dengan mengasumsikan nol pencampuran awal menggunakan model yang lebih baik. Tampaknya lebih baik untuk mengadaptasi model ke masalah daripada memalsukan jawaban agar sesuai dengan prasangka. (+1)
Carl