Contoh bagaimana Bayesian Statistics dapat memperkirakan parameter yang sangat sulit untuk diperkirakan melalui metode frequentist

9

Ahli statistik Bayesian berpendapat bahwa "Statistik Bayesian dapat memperkirakan parameter yang sangat sulit untuk diperkirakan melalui metode yang sering". Apakah kutipan berikut yang diambil dari dokumentasi SAS ini mengatakan hal yang sama?

Ini memberikan kesimpulan yang tergantung pada data dan tepat, tanpa bergantung pada perkiraan asimptotik. Inferensi sampel kecil berlangsung dengan cara yang sama seolah-olah seseorang memiliki sampel besar. Analisis Bayesian juga dapat memperkirakan setiap fungsi parameter secara langsung, tanpa menggunakan metode "plug-in" (cara untuk memperkirakan fungsional dengan cara memasukkan parameter yang diperkirakan dalam fungsional).

Saya melihat pernyataan serupa di beberapa buku teks tetapi tidak ingat di mana. Adakah yang bisa menjelaskan hal ini kepada saya dengan sebuah contoh?

Stat-R
sumber
Berapa probabilitas bahwa matahari akan terbit besok? en.wikipedia.org/wiki/Sunrise_problem Contoh ini mungkin lebih sepele daripada yang Anda harapkan
Hugh
Bisakah Anda menempatkan kutipan langsung ke pertanyaan Anda? Judul itu tampaknya tidak terkait dengan poin kedua.
Hugh
1
Pernyataan dalam kutipan itu tidak bagus karena (a) "tepat" tidak berarti apa-apa di sana dan (b) kritik plug-in hanya berlaku ketika seseorang menganggap posterior lengkap dan bukan perkiraan lain, ditambah tergantung pada fungsi kerugian yang dipilih untuk estimasi. Lihat pertanyaan lain ini untuk beberapa jawaban .
Xi'an

Jawaban:

8

Saya keberatan dengan kutipan itu:

  1. "Frequentism" adalah pendekatan untuk inferensi yang didasarkan pada properti frekuensi dari estimator yang dipilih. Ini adalah gagasan yang kabur karena tidak menyatakan bahwa penduga harus konvergen dan jika mereka melakukannya di bawah bagaimana mereka harus bertemu. Misalnya, ketidakberpihakan adalah gagasan yang sering terjadi tetapi tidak dapat berlaku untuk setiap dan setiap fungsi [dari parameter ] yang menarik karena pengumpulan transformasi yang memungkinkan untuk estimator yang tidak bias sangat terbatas. Lebih lanjut, estimator frequentist tidak dihasilkan oleh paradigma tetapi harus dipilih terlebih dahulu sebelum dievaluasi. Dalam pengertian itu, estimator Bayesian adalah estimator frequentist jika memenuhi beberapa properti frequentist.θθθ
  2. Kesimpulan yang dihasilkan oleh pendekatan Bayesian didasarkan pada distribusi posterior, diwakili oleh kepadatannya . Saya tidak mengerti bagaimana istilah "tepat" dapat dilampirkan ke . Ini secara unik dikaitkan dengan distribusi sebelumnya dan itu persis diturunkan oleh teorema Bayes. Tapi itu tidak mengembalikan inferensi yang tepat dalam bahwa estimasi titik bukanlah nilai sebenarnya dari parameter dan itu menghasilkan pernyataan probabilitas yang tepat hanya dalam kerangka yang disediakan oleh pasangan sebelum x kemungkinanπ ( θ | D ) π ( θ ) θπ(θ|D)π(θ|D)π(θ)θ. Mengubah satu istilah dalam pasangan tidak memodifikasi posterior dan kesimpulan, sementara tidak ada argumen generik untuk membela tunggal kemungkinan sebelumnya atau.
  3. Demikian pula, pernyataan probabilitas lain seperti "parameter sebenarnya memiliki probabilitas 0,95 jatuh dalam interval kredibel 95%" ditemukan di halaman yang sama dari dokumentasi SAS ini memiliki makna relatif terhadap kerangka distribusi posterior tetapi tidak dalam nilai absolut.
  4. Dari perspektif komputasi, memang benar bahwa pendekatan Bayesian mungkin sering mengembalikan jawaban yang tepat atau perkiraan dalam kasus ketika pendekatan klasik standar gagal. Ini misalnya kasus untuk model variabel laten [atau hilang] mana adalah kepadatan bersama untuk pasangan dan di mana tidak diamati, Menghasilkan estimasi dan posteriornya dengan simulasi pasangan mungkin terbukti jauh lebih mudah daripada menurunkan penduga kemungkinan [frequentist?] maksimum. Contoh praktis dari pengaturan ini adalah model gabungan Kingman dalam genetika populasig ( x , z | θ ) ( X , Z ) Z θ ( θ , Z )
    f(x|θ)=g(x,z|θ)dz
    g(x,z|θ)(X,Z)Zθ(θ,Z), di mana evolusi populasi dari nenek moyang yang sama melibatkan peristiwa laten di pohon biner. Model ini dapat ditangani oleh [perkiraan] inferensi Bayesian melalui suatu algoritma yang disebut ABC, meskipun ada juga resolusi perangkat lunak non-Bayesian .
  5. Namun, bahkan dalam kasus seperti itu, saya tidak berpikir bahwa kesimpulan Bayesian adalah satu-satunya resolusi yang mungkin. Teknik pembelajaran mesin seperti jaring saraf, hutan acak, pembelajaran dalam, dapat diklasifikasikan sebagai metode yang sering dilakukan karena mereka melatih sampel dengan validasi silang, meminimalkan kesalahan atau kriteria jarak yang dapat dilihat sebagai harapan [di bawah model yang sebenarnya] didekati dengan rata-rata sampel. Misalnya, model gabungan Kingman juga dapat ditangani dengan resolusi perangkat lunak non-Bayesian .
  6. Poin terakhir adalah bahwa, untuk estimasi titik, pendekatan Bayesian mungkin menghasilkan estimasi plug-in. Untuk beberapa fungsi kerugian yang saya sebut kerugian intrinsik , penaksir Bayes dari transform adalah transformasi dari estimator Bayes dari .h ( θ ) θh(θ)h(θ^)θ
Xi'an
sumber
Jawabannya bagus sejauh ini. Saya keberatan dengan poin # 5, karena atribut untuk metode ML kinerja yang unggul yang belum dibenarkan oleh teori. Apa artinya "... model yang sebenarnya ..."? Tidak diragukan lagi, metode ini populer, tetapi popularitas itu biasanya dibenarkan oleh kemampuan mereka "untuk skala." Sayangnya, banyak wawasan diagnostik yang ditawarkan oleh metode Bayesian non-ML dan sering hilang ketika pendekatan seperti itu digunakan. Secara khusus, validasi silang dapat menghasilkan tingkat kesalahan yang lebih tinggi daripada teknik lain Lihat Efron, 1983, 1986, JASA.
Jan Galkowski
Terima kasih. Sebenarnya, saya tidak memberikan metode ML dengan kekuatan "superior", cukup sebutkan bahwa beberapa jawaban ML mungkin diajukan untuk model yang kompleks. Dan dengan "model yang sebenarnya", maksud saya penilaian kinerja metode dengan asumsi (salah) bahwa data dihasilkan oleh model tersebut. Yang merupakan cacat dari sebagian besar analisis statistik imo.
Xi'an