Bisakah Anda membantu saya memahami sudut pandang frequentist dalam debat bayesian vs frequentist? Saya telah membaca banyak dan semua sumber yang saya temukan dipenuhi dengan persamaan yang kompleks atau ditulis dari sudut pandang bayesian, atau keduanya. Saya belum menemukan satu sampel masalah di mana pendekatan frequentist akan menghasilkan keluaran yang lebih bermanfaat daripada pendekatan bayesian. Saya merasa seperti saya hanya memahami satu sisi dari perdebatan ini dan saya ingin memahami sisi lain juga. Saya tidak memiliki latar belakang dalam statistik, jadi saya akan menghargai contoh sederhana dari kasus di mana metode frequentist menghasilkan nilai lebih dari metode bayesian.
Contoh yang bagus adalah skenario taruhan di mana taruhan frequentist dan bayesian terhadap satu sama lain tentang beberapa hasil di masa depan dan frequentist memiliki nilai yang diharapkan positif.
sumber
Jawaban:
Saya tidak akan memberi Anda contoh ini karena contoh seperti itu akan mendukung pendekatan Bayesian kecuali jika Bayesian memilih yang buruk sebelumnya yang merupakan contoh cop-out yang tidak benar-benar layak untuk ditulis.
Pendekatan yang paling sering tidak dirancang untuk mendapatkan nilai yang diharapkan tertinggi dalam skenario taruhan (untungnya dunia statistik dan probabilitas jauh lebih luas daripada hanya itu). Sebaliknya, teknik frequentist dirancang untuk menjamin sifat frekuensi tertentu yang diinginkan, khususnya cakupan. Properti ini penting untuk estimasi parameter dan inferensi dalam konteks penelitian dan penyelidikan ilmiah.
Saya mendorong Anda untuk melihat tautan ini di sini ke posting blog oleh Dr. Larry Wasserman. Di dalamnya dia berbicara tentang jaminan frekuensi secara lebih mendalam (lihat contoh yang dia berikan).
Misalkan kita memiliki beberapa data dan kami pikir itu didistribusikan menurut beberapa distribusi bersyarat (jika Anda suka, Anda dapat membayangkan bahwa terdistribusi secara normal dan adalah mean dan \ atau varians). Kita tidak tahu nilai , jadi kita harus memperkirakannya. Kita dapat menggunakan pendekatan frequentist atau Bayesian untuk melakukannya.Y Y∼ f( Y|θ∗) Y θ∗ θ∗
Dalam pendekatan frequentist kita akan memperoleh estimasi titik dan interval kepercayaan untuk estimasi itu. Dengan asumsi ada dan model itu valid dan berperilaku baik, interval kepercayaan frequentist dijamin mengandung % dari waktu terlepas dari apa yang sebenarnya . bisa 0, bisa 1.000.000, bisa -53.2, tidak masalah, pernyataan di atas berlaku.θ^ θ∗ ( 1 - α ) θ∗ ( 1 - α ) θ∗ θ∗
Namun, hal di atas tidak berlaku untuk interval kepercayaan Bayesian atau dikenal sebagai interval yang kredibel. Ini karena, dalam pengaturan Bayesian, kita harus menentukan dan mensimulasikan dari posterior, . Kami dapat membentuk % interval kredibel menggunakan sampel yang dihasilkan, tetapi probabilitas bahwa interval ini akan mengandung tergantung pada seberapa besar kemungkinan berada di bawah prioritas kami sebelumnya.θ ∼ π( θ ) π( θ | Y) ∝ f( Y| θ)π( θ ) ( 1 - α ) θ∗ θ∗
Dalam skenario taruhan, kami mungkin percaya bahwa nilai-nilai tertentu cenderung menjadi daripada yang lain, dan kami dapat menetapkan sebelum mencerminkan kepercayaan ini. Jika keyakinan kami akurat, kemungkinan mengandung dalam interval yang kredibel lebih tinggi. Inilah sebabnya mengapa orang pintar yang menggunakan teknik Bayesian dalam skenario taruhan sering mengalahkan.θ∗ θ∗
Tetapi pertimbangkan skenario yang berbeda, seperti studi di mana Anda menguji pengaruh pendidikan terhadap upah, sebut saja , dalam model regresi. Banyak peneliti lebih suka interval kepercayaan untuk memiliki properti frekuensi cakupan daripada mencerminkan tingkat kepercayaan mereka sendiri mengenai pengaruh pendidikan terhadap upah.β β
Dari sudut pandang pragmatis, harus juga dicatat bahwa dalam contoh saya sebelumnya, ketika ukuran sampel mendekati tak terhingga, baik dan posterior Bayesian berkumpul ke . Jadi, saat Anda mendapatkan lebih banyak data, perbedaan antara pendekatan Bayesian dan sering menjadi diabaikan. Karena estimasi Bayesian sering (tidak selalu) lebih komputasional dan matematis daripada estimasi frequentist, praktisi sering memilih teknik frequentist ketika mereka memiliki set data "besar". Ini benar bahkan ketika tujuan utama adalah prediksi yang bertentangan dengan estimasi / inferensi parameter.θ^ π( θ | Y) θ∗
sumber