Saya mengajar fisika untuk siswa sekolah menengah, dan saya ingin siswa saya melakukan perbandingan model Bayesian yang belum sempurna untuk data dari eksperimen mereka. Saya menemukan cara bagi mereka untuk melakukannya (lihat di bawah), tetapi saya tidak yakin itu benar. Saya akan sangat menghargai umpan balik tentang itu (terutama umpan balik negatif!), Atau saran tentang bagaimana melakukannya dengan lebih baik.
Saya ingin membandingkan teori linear, dengan parameter kemiringan dan mencegat , dengan hipotesis nol dari konstanta yaitu kemiringan = 0. Dalam kedua kasus saya menganggap noise simetris Gaussian.
Para siswa dapat memperoleh, menggunakan Excel, perkiraan kemungkinan maksimum untuk kemiringan dan mencegat ( dan ), dan kesalahan mereka dan .
- Untuk sebelumnya pada lereng, saya mempertimbangkan Gaussian luas, berpusat pada maksimum = perkiraan kemungkinan ( ) dan dengan standar deviasi sepuluh kali lipat. Alasan saya adalah bahwa saya secara realistis mengharapkan mereka untuk menemukan parameter garis "benar" paling tidak dalam besaran, dan dalam praktiknya mereka akan menemukan yang lebih dekat lagi jadi jika saya mengganti lereng "benar" dengan MLE-nya, saya tidak akan mengubah angka terlalu banyak.
- Untuk kemungkinan bukti yang diberikan teori linear tertentu, saya mempertimbangkan distribusi Gaussian multivariat standar, dengan standar deviasi ( ) terkait dengan jumlah residu kuadrat.
- Kemungkinan bukti untuk teori linier secara umum, yaitu integral dari sebelum dan kemungkinan di atas, karenanya diperkirakan sebagai yang sebelumnya dan kemungkinan pada titik MLE, dikalikan kesalahan dalam kemiringan .
- Kemungkinan bukti yang diberikan hipotesis nol diasumsikan sebagai Gaussian multivariat lain, sekarang menggunakan standar deviasi total ( ), berdasarkan perbedaan dari rata-rata-Y.
Ini adalah bagian yang saya paling tidak yakin: Saya memperkirakan faktor Bayes menjadi rasio dari dua kemungkinan di atas (3 dan 4 di atas), yang memungkinkan saya untuk menghasilkan rumus berikut:
Apakah ini akan memberi kami perkiraan yang masuk akal untuk faktor Bayes? Setiap umpan balik diterima.
sumber
Jawaban:
Pertama, izinkan saya mengatakan bahwa pengujian yang masuk akal terhadap hipotesis yang tajam seperti memerlukan distribusi yang matang sebelumnya untuk , karena faktor Bayes sangat bergantung pada hal ini sebelumnya. Banyak orang Bayesian tidak akan menguji hipotesis yang tajam, tetapi saya akan melakukannya.a=0 a
Sebelum melanjutkan, saya harus memberi tahu Anda bahwa saya tidak benar-benar mengerti apa yang Anda katakan sedang Anda lakukan dan jadi saya mungkin memberi Anda nasihat yang tidak Anda cari. Saya harap Anda dapat mengikuti notasi may.
Biarkan data menjadi pengamatan: , di mana (menurut model yang lebih umum dan termasuk kemiringan) (Saya menekan variabel independen dari daftar argumen pengkondisian untuk kesederhanaan notasi.) Kemungkinan diberikan oleh Diberi sebelum , distribusi posterior adalah mana kemungkinan data menurut model yang lebih umum adalahn y=((x1,y1),…,(xn,yn))
Dengan ekspresi ini, kita sekarang dapat menulis posterior marginal untuk : kita akan mengatur ulang ungkapan ini: Karena ungkapan ini benar untuk setiap nilai , itu benar khususnya untuk : Perhatikan bahwa pembilang dalam fraksi di sisi kiri adalah kemungkinan data sesuai dengan model terbatas (yaitu, terbatas padaa
Fraksi di sebelah kanan memberi kita cara untuk mengevaluasi faktor Bayes: Dikatakan membagi kepadatan posterior dievaluasi pada dengan kepadatan sebelumnya dievaluasi pada . (By the way, "formula" yang disebut rasio kepadatan Savage-Dickey.) Sekarang jelas mengapa sebelum bijaksana untuk diperlukan. Jika kita membiarkan kepadatan sebelumnya untuk sangat tidak pasti, kepadatan sebelum akan sangat rendah di mana-mana termasuk di , tetapi kepadatan posterior di tidak akan pergi ke nol, dan akibatnya faktor Bayes akan pergi ke infinity. Dalam hal ini, "sampah masuk" menghasilkan "sampah keluar."a=0 a=0 a a a=0 a=0
Anda mungkin membayangkan bahwa jika Anda tidak mengikuti langkah-langkah yang telah saya uraikan, maka Anda tidak akan mengalami masalah ini, tetapi Anda akan salah. Logika yang saya sampaikan berlaku terlepas dari "algoritma" yang Anda terapkan.
Tapi langkah-langkahnya memang menyediakan algoritma yang bisa bermanfaat. Misalkan prior untuk parameter diberikan oleh "Jeffreys prior" Ini sama dengan menggunakan yang tidak patut sebelum "parameter gangguan" . Ini baik-baik saja, tapi sebelum itu tidak akan sesuai untuk untuk alasan saya dibahas di atas. Dengan ini sebelumnya, --- yang (marginal) kemungkinan untuk --- akan sebanding dengan Mahasiswa distribusi, parameter yang tergantung pada data . Ini distribusi ringkasan lengkap dari data, yang dapat dibuang. Sekarang Anda harus memilih yang tepat dan mendapat informasi sebelum
Saya harap Anda menemukan sesuatu dalam apa yang saya katakan bermanfaat.
sumber