Apakah BIC dapat Digunakan untuk Pengujian Hipotesis

8

Tetapkan kriteria informasi Bayesian sebagai (saya tidak menjatuhkan konstan, , untuk menghindari masalah ketika menyamakan dengan kemungkinan marginal)

BIC=2lnL^+k(ln(n)ln(2π))
ln(2π)

Diberikan data dan model , perkiraan hubungan antara kemungkinan marginal dan adalah yang tampaknya menyiratkan YHiP(Y|Hi)BICi

2lnP(Y|Hi)BICi
P(Y|Hi)exp(BICi2)

Mengingat nol dan model alternatif, dan masing-masing, uji hipotesis Bayesian untuk probabilitas bersyarat alternatif pada data dapat dihitung sebagai mana probabilitas sebelumnya, untuk . Pertanyaan saya adalah kapan, jika pernah, boleh-boleh saja memperkirakan untuk pengujian hipotesis Bayesian. Terlepas dari kesederhanaan persamaan di atas, saya jarang melihatnya digunakan dalam praktik yang membuat saya ragu keandalannya sebagai perkiraan.H0H1

P(H1|Y)=P(Y|H1)P(Y|H0)+P(Y|H1)
P(Hi)=1/2i=1,2
P(H1|Y)exp(BIC12)exp(BIC02)+exp(BIC12)
Zachary Blumenfeld
sumber
Perhatikan bahwa ketika melakukan perhitungan di atas di akhir, apakah Anda menjatuhkan konstanta tidak penting.
Glen_b -Reinstate Monica

Jawaban:

5

Anda dapat membuat aproksimasi asimptotik seperti itu, tetapi perhatikan bahwa Anda dapat menulis ulang dalam hal perbedaan dari (katakanlah) (atau bahkan konstanta yang nyaman). Ini dapat membantu menghindari masalah dengan underflow atau overflow ketika angka eksponensial yang mungkin sangat jauh dari 0.BIC0

Perhatikan lebih lanjut bahwa (menggunakan pendekatan yang mirip dengan yang Anda gunakan) itu menggeneralisasi ke koleksi model alternatif yang lebih besar daripada hanya dua.

Saya tidak akan menyebutnya "pengujian hipotesis"; menurut saya ini lebih dekat dengan pemilihan model Bayesian, tetapi itu terjadi lebih sering dalam konteks yang terkait tetapi sedikit berbeda. (Namun, jangan pedulikan saya, orang lain telah menyebutnya atau sesuatu yang sangat mirip dengan itu sebagai pengujian hipotesis, Anda mungkin dapat menemukan beberapa contoh di antara referensi di tautan di bawah, dan di tempat lain.)

Ini (atau bentuk yang sedikit ditulis ulang) adalah perkiraan yang sering saya lihat (saya kira itu tergantung pada hal-hal yang Anda baca), dan memang menghasilkan probabilitas posterior perkiraan dari model yang sedang dipertimbangkan (di bawah serangkaian tertentu asumsi).

Ini terjadi terutama dalam konteks diskusi model rata - rata atau ketidakpastian model , di mana daripada memilih model tertentu dan mengkondisikan pilihan itu, semua * model ditimbang oleh probabilitas posterior mereka, agar (misalnya) untuk menghasilkan distribusi prediksi.

* atau kadang-kadang hanya sebagian dari model dengan probabilitas posterior tertinggi, seringkali sebagai perkiraan keseluruhan, tetapi kadang-kadang set yang sangat besar. (lihat juga jendela Occam )

Jika Anda mencari pada model Bayesian rata - rata dan BIC Anda harus dapat membuat beberapa referensi (nama-nama seperti Hoeting, Raftery atau Madigan ada di beberapa makalah, tetapi banyak penulis lain menulis tentang hal ini); jika Anda tidak dapat menemukannya, saya dapat menunjukkan beberapa.

Sama seperti satu contoh, dalam Raftery [1], persamaan 35, ia menggunakan ekspresi seperti yang Anda miliki di atas tetapi digeneralisasi ke model .k

Coba tautan ini, yang memiliki sejumlah makalah yang melakukan sesuatu sesuai dengan apa yang Anda uraikan (untuk tautan pertama, saya tidak dapat memuat sumber asli sehingga saya telah pergi ke versi terakhir di archive.org):

https://web.archive.org/web/20150925053749/http://www2.research.att.com/~volinsky/bma.html

http://www.stat.washington.edu/raftery/Research/bma.html

(tidak semua tautan di halaman-halaman itu akan menjadi apa yang Anda cari, tetapi masing-masing akan memiliki banyak makalah yang berhubungan dengan itu.)

[1] Raftery, AE (1995).
"Pemilihan model Bayesian dalam penelitian sosial (dengan Diskusi)."
Metodologi Sosiologis , 25, 111-196.

Glen_b -Reinstate Monica
sumber
Mungkin ini menyentuh pembuluh darah yang Anda singgung. Apakah probabilitas hipotesis diberikan data, atau invers analog sering lebih sering, merupakan bagian penting dari pengujian hipotesis? Tidakkah pengujian hipotesis bermuara pada keputusan yang dibuat? Dalam hal ini, tidak bisakah Anda memanggil BIC_1 <keputusan BIC_0 yang menentukan jenis pengujian hipotesis?
russellpierce