Contoh konkret dari pendekatan frequentist yang lebih unggul daripada pendekatan Bayesian [ditutup]

Bisakah Anda membantu saya memahami sudut pandang frequentist dalam debat bayesian vs frequentist? Saya telah membaca banyak dan semua sumber yang saya temukan dipenuhi dengan persamaan yang kompleks atau ditulis dari sudut pandang bayesian, atau keduanya. Saya belum menemukan satu sampel masalah di mana pendekatan frequentist akan menghasilkan keluaran yang lebih bermanfaat daripada pendekatan bayesian. Saya merasa seperti saya hanya memahami satu sisi dari perdebatan ini dan saya ingin memahami sisi lain juga. Saya tidak memiliki latar belakang dalam statistik, jadi saya akan menghargai contoh sederhana dari kasus di mana metode frequentist menghasilkan nilai lebih dari metode bayesian.

Contoh yang bagus adalah skenario taruhan di mana taruhan frequentist dan bayesian terhadap satu sama lain tentang beberapa hasil di masa depan dan frequentist memiliki nilai yang diharapkan positif.

bayesian frequentist Atte Juvonen
sumber

Tentunya Anda dapat menemukan beberapa puluh ribu contoh seperti itu hanya dengan menjelajahi situs ini. Mengingat hal ini, jawaban seperti apa yang Anda cari?

whuber

Setelah 2 jam googling saya menemukan 0 contoh di mana pendekatan frequentist lebih bermanfaat daripada Bayesian. Jika Anda memiliki 10.000 contoh, dapatkah Anda memberikan 1 di antaranya? Terima kasih.

Atte Juvonen

Saya tidak tahu apakah ini setingkat yang Anda inginkan, tetapi Anda dapat menemukan diskusi yang relevan dalam buku L. Wasserman yang tersedia secara online juga. read.pudn.com/downloads158/ebook/702714/… . Jika Anda pergi ke halaman 216, Anda akan menemukan contoh mengenai interval kepercayaan di mana pendekatan frequentist mengungguli Bayesian.

JohnK

@whuber: Saya tidak percaya definisi Anda tentang "berguna" akan berbeda dari saya dengan cara di mana itu bermakna untuk membahasnya. Saya di sini bukan untuk menyimpulkan bahwa bayesian> sering. Saya baru-baru ini belajar tentang mata pelajaran ini dan saya merasa seperti saya hanya memahami satu sisi dari perdebatan. Saya ingin memahami sisi lain juga. Saya merasa paling mudah untuk memahami konsep-konsep baru melalui contoh-contoh praktis; dalam hal ini contoh di mana frequentism memberikan sesuatu yang bernilai (di mana metode bayesian gagal)

Atte Juvonen

Saya memilih untuk membuka kembali. @whuber, fakta bahwa 20k + orang datang ke sini untuk mengajukan pertanyaan tentang teknik frequentist dan mendapatkan jawaban yang bermanfaat tidak menyiratkan bahwa teknik frequentist lebih tepat daripada teknik Bayesian dalam kasus-kasus tertentu; itu hanya berarti bahwa mereka tersebar luas.

amoeba

Contoh yang bagus adalah skenario taruhan di mana taruhan frequentist dan Bayesian terhadap satu sama lain tentang beberapa hasil di masa depan dan frequentist memiliki nilai yang diharapkan positif.

Saya tidak akan memberi Anda contoh ini karena contoh seperti itu akan mendukung pendekatan Bayesian kecuali jika Bayesian memilih yang buruk sebelumnya yang merupakan contoh cop-out yang tidak benar-benar layak untuk ditulis.

Pendekatan yang paling sering tidak dirancang untuk mendapatkan nilai yang diharapkan tertinggi dalam skenario taruhan (untungnya dunia statistik dan probabilitas jauh lebih luas daripada hanya itu). Sebaliknya, teknik frequentist dirancang untuk menjamin sifat frekuensi tertentu yang diinginkan, khususnya cakupan. Properti ini penting untuk estimasi parameter dan inferensi dalam konteks penelitian dan penyelidikan ilmiah.

Saya mendorong Anda untuk melihat tautan ini di sini ke posting blog oleh Dr. Larry Wasserman. Di dalamnya dia berbicara tentang jaminan frekuensi secara lebih mendalam (lihat contoh yang dia berikan).

Misalkan kita memiliki beberapa data dan kami pikir itu didistribusikan menurut beberapa distribusi bersyarat (jika Anda suka, Anda dapat membayangkan bahwa terdistribusi secara normal dan adalah mean dan \ atau varians). Kita tidak tahu nilai , jadi kita harus memperkirakannya. Kita dapat menggunakan pendekatan frequentist atau Bayesian untuk melakukannya. $Y$ $Y \sim f(Y|\theta^*)$ $Y$ $\theta^*$ $\theta^*$

Dalam pendekatan frequentist kita akan memperoleh estimasi titik dan interval kepercayaan untuk estimasi itu. Dengan asumsi ada dan model itu valid dan berperilaku baik, interval kepercayaan frequentist dijamin mengandung % dari waktu terlepas dari apa yang sebenarnya . bisa 0, bisa 1.000.000, bisa -53.2, tidak masalah, pernyataan di atas berlaku. $\hat \theta$ $\theta^*$ $(1-\alpha)$ $\theta^*$ $(1-\alpha)$ $\theta^*$ $\theta^*$

Namun, hal di atas tidak berlaku untuk interval kepercayaan Bayesian atau dikenal sebagai interval yang kredibel. Ini karena, dalam pengaturan Bayesian, kita harus menentukan dan mensimulasikan dari posterior, . Kami dapat membentuk % interval kredibel menggunakan sampel yang dihasilkan, tetapi probabilitas bahwa interval ini akan mengandung tergantung pada seberapa besar kemungkinan berada di bawah prioritas kami sebelumnya. $\theta \sim \pi(\theta)$ $\pi(\theta|Y) \propto f(Y|\theta)\pi(\theta)$ $(1-\alpha)$ $\theta^*$ $\theta^*$

Dalam skenario taruhan, kami mungkin percaya bahwa nilai-nilai tertentu cenderung menjadi daripada yang lain, dan kami dapat menetapkan sebelum mencerminkan kepercayaan ini. Jika keyakinan kami akurat, kemungkinan mengandung dalam interval yang kredibel lebih tinggi. Inilah sebabnya mengapa orang pintar yang menggunakan teknik Bayesian dalam skenario taruhan sering mengalahkan. $\theta^*$ $\theta^*$

Tetapi pertimbangkan skenario yang berbeda, seperti studi di mana Anda menguji pengaruh pendidikan terhadap upah, sebut saja , dalam model regresi. Banyak peneliti lebih suka interval kepercayaan untuk memiliki properti frekuensi cakupan daripada mencerminkan tingkat kepercayaan mereka sendiri mengenai pengaruh pendidikan terhadap upah. $\beta$ $\beta$

Dari sudut pandang pragmatis, harus juga dicatat bahwa dalam contoh saya sebelumnya, ketika ukuran sampel mendekati tak terhingga, baik dan posterior Bayesian berkumpul ke . Jadi, saat Anda mendapatkan lebih banyak data, perbedaan antara pendekatan Bayesian dan sering menjadi diabaikan. Karena estimasi Bayesian sering (tidak selalu) lebih komputasional dan matematis daripada estimasi frequentist, praktisi sering memilih teknik frequentist ketika mereka memiliki set data "besar". Ini benar bahkan ketika tujuan utama adalah prediksi yang bertentangan dengan estimasi / inferensi parameter. $\hat \theta$ $\pi(\theta|Y)$ $\theta^*$

Zachary Blumenfeld
sumber

+1 tetapi mengenai contoh regresi Anda (menguji pengaruh pendidikan terhadap upah), sementara saya setuju bahwa "banyak penelitian" (termasuk saya!) Lebih suka menggunakan prosedur yang sering, ada banyak orang, termasuk ahli statistik, mengatakan bahwa ini seluruh pendekatan salah arah dan tidak berfungsi sebagaimana mestinya atau bahkan seperti yang dimaksudkan. Ini bukan tempat untuk memperdebatkannya, tetapi harus disebutkan bahwa sudut pandang ini juga ada.

amoeba

@amoeba, cukup banyak dari semua argumen itu bukan tentang pendekatan yang sering digunakan per se tetapi tentang penggunaan yang berlebihan, penyalahgunaan, dan kesalahpahaman dari mereka.

John

Zachary, saat utas ini ditutup, apakah Anda keberatan atau mungkin lebih suka jika jawaban Anda dipindahkan di stats.stackexchange.com/questions/194035 ? Ini dapat dilakukan jika utas ini "digabungkan" menjadi yang itu (yaitu ditutup sebagai duplikat dan semua jawaban dipindahkan). Saya pikir ini bisa membantu.

amoeba

@amoeba yakin, jika Anda berpikir itu akan membantu.

Zachary Blumenfeld

"Aku tidak akan memberimu contoh ini karena contoh seperti itu akan mendukung pendekatan Bayesian kecuali jika Bayesian memilih yang buruk sebelumnya yang merupakan contoh cop-out yang tidak benar-benar layak ditulis tentang." Saya sangat tidak setuju dengan ini. Ini adalah alasan mendasar untuk mempertimbangkan statistik sering di tempat pertama: prior yang baik sulit didapat. Hasil Bayesian secara sepele lebih baik dengan prior yang baik, tetapi memperoleh prior yang bagus sangat tidak sepele.

Cliff AB

Contoh konkret dari pendekatan frequentist yang lebih unggul daripada pendekatan Bayesian [ditutup]

Jawaban: