Contoh pendekatan Bayesian dan frequentist memberikan jawaban yang berbeda

54

Catatan: Saya saya menyadari filosofis perbedaan antara Bayesian dan statistik frequentist.

Misalnya "berapa probabilitas bahwa koin di atas meja adalah kepala" tidak masuk akal dalam statistik sering, karena sudah ada kepala atau ekor yang mendarat - tidak ada yang probabilistik tentang hal itu. Jadi pertanyaannya tidak memiliki jawaban dalam istilah yang sering.

Tetapi perbedaan seperti itu secara khusus bukan jenis perbedaan yang saya tanyakan.

Sebaliknya, saya ingin tahu bagaimana prediksi mereka untuk pertanyaan yang terbentuk benar-benar berbeda di dunia nyata, tidak termasuk perbedaan teoretis / filosofis seperti contoh yang saya sebutkan di atas.

Jadi dengan kata lain:

Apa contoh dari pertanyaan, jawab di kedua frequentist dan statistik Bayesian, yang jawabannya berbeda antara keduanya?

(mis. Mungkin salah satu dari mereka menjawab "1/2" untuk pertanyaan tertentu, dan yang lain menjawab "2/3".)

Apakah ada perbedaan seperti itu?

  • Jika demikian, apa saja contohnya?

  • Jika tidak, lalu kapan itu benar-benar membuat perbedaan apakah saya menggunakan statistik Bayesian atau frequentist ketika memecahkan masalah tertentu?
    Mengapa saya menghindari satu demi yang lain?

Mehrdad
sumber
8
John Kruschke baru saja menghasilkan dua video di mana ia membandingkan metode statistik Bayesian dan standar. Dia memiliki banyak contoh di mana metode Bayesian menolak tetapi metode standar tidak. Mungkin tidak persis apa yang Anda cari, tetapi toh ... youtu.be/YyohWpjl6KU dan youtu.be/IhlSD-lIQ_Y .
Rasmus Bååth
4
Distribusi binomial memberikan contoh lain di mana inferensi frequentist (likelihood-based) dan inferensi Bayesian berbeda dalam beberapa kasus. Kemungkinan profil dari parameter tidak membusuk ke karena ( lihat ) untuk beberapa sampel. Ini menyiratkan bahwa beberapa interval kemungkinan-kepercayaan memiliki panjang yang tak terbatas. Di sisi lain, distribusi posterior marginal selalu meluruh ke karena mengingat bahwa ia dapat diintegrasikan. 0 N N 0 N N0NN0N
@Prastrastator: Terima kasih, saya sedang melihat slide yang disebutkan sekarang. Ini tampaknya sedikit lebih kuat daripada latar belakang matematis saya, tetapi mudah-mudahan saya akan mendapatkan sesuatu darinya. :)
Mehrdad
2
Anda mungkin ingin melihat contoh Stone. Saya jelaskan di blog saya di sini: normaldeviate.wordpress.com/2012/12/08/...
Larry Wasserman
1
@mbq: Hanya ingin tahu, mengapa ini membuat komunitas wiki?
Mehrdad

Jawaban:

9

Contoh ini diambil dari sini . (Saya bahkan berpikir saya mendapat tautan ini dari SO, tetapi tidak dapat menemukannya lagi.)

Koin telah dilempar kali, muncul kepala k = 10 kali. Jika harus dilempar dua kali lagi, akankah Anda bertaruh dengan dua kepala? Asumsikan Anda tidak dapat melihat hasil dari lemparan pertama sebelum lemparan kedua (dan juga tergantung pada θ ), sehingga Anda tidak dapat memperbarui pendapat Anda tentang θ di antara dua lemparan.n=14k=10θθ

Dengan independensi, Kemudian, distribusi prediktif yang diberikan sebelum Beta ( α 0 , β 0 ) menjadi

f(yf,1=heads,yf,2=heads|θ)=f(yf,1=heads)f(yf,2=heads|θ)=θ2.
Beta(α0,β0) Untuk seragam sebelum (aBeta(1,1)-sebelum), ini memberikan sekitar 0,485. Karenanya, Anda kemungkinan tidak akan bertaruh. Berdasarkan MLE 10/14, Anda akan menghitung probabilitas dari dua kepala(10/14)20,51, sehingga taruhan akan masuk akal.
f(yf,1=kepala,yf,2=kepala|y)=f(yf,1=kepala,yf,2=kepala|θ)π(θ|y)dθ=Γ(α0+β0+n)Γ(α0+k)Γ(β0+n-k)θ2θα0+k-1(1-θ)β0+n-k-1dθ=Γ(α0+β0+n)Γ(α0+k)Γ(β0+n-k)Γ(α0+k+2)Γ(β0+n-k)Γ(α0+β0+n+2)=(α0+k)(α0+k+1)(α0+β0+n)(α0+β0+n+1)
Beta(1,1)(10/14)20,51
Christoph Hanck
sumber
+1 persis jenis jawaban yang saya cari, terima kasih.
Mehrdad
5
Sebenarnya ada pembaruan untuk posting yang dirujuk dalam jawaban ... Meskipun dia meninggalkan posting, "daripada menggunakan distribusi seragam sebagai sebelumnya, kita bisa menjadi lebih agnostik. Dalam hal ini, kita dapat menggunakan Beta ( 0,0) distribusi sebagai prior. Distribusi semacam itu sesuai dengan kasus di mana rata-rata distribusi kemungkinannya sama. Dalam kasus ini, dua pendekatan, Bayesian dan frequentist memberikan hasil yang sama. " !!! Jadi kita masih membutuhkan contoh untuk menjawab pertanyaan ini! Karenanya +1 ke jawaban di bawah ini sebagai jawaban sebenarnya untuk pertanyaan ini.
user1745038
10

Lihat pertanyaan saya di sini , yang menyebutkan sebuah makalah oleh Edwin Jaynes yang memberikan contoh interval kepercayaan frequentist yang dibangun dengan benar, di mana ada informasi yang cukup dalam sampel untuk mengetahui dengan pasti bahwa nilai sebenarnya dari statistik terletak pada interval kepercayaan ( dan dengan demikian interval kepercayaan berbeda dari interval kredibel Bayesian).

Namun, alasan untuk ini adalah perbedaan dalam definisi interval kepercayaan dan interval kredibel, yang pada gilirannya merupakan konsekuensi langsung dari perbedaan definisi probabilitas frequentist dan Bayesian. Jika Anda meminta seorang Bayesian untuk menghasilkan interval kepercayaan Bayesian (daripada kredibel), maka saya menduga bahwa akan selalu ada yang sebelumnya intervalnya akan sama, sehingga perbedaannya tergantung pada pilihan sebelumnya.

Apakah metode frequentist atau Bayesian sesuai tergantung pada pertanyaan yang ingin Anda ajukan, dan pada akhirnya adalah perbedaan dalam filosofi yang menentukan jawabannya (asalkan upaya komputasi dan analitik yang diperlukan bukan merupakan pertimbangan).

Menjadi agak bungkam, dapat dikatakan bahwa frekuensi jangka panjang adalah cara yang masuk akal untuk menentukan masuk akal relatifnya suatu proposisi, dalam hal ini statistik frequentist adalah subset yang agak aneh dari Bayesianisme subyektif - sehingga pertanyaan yang sering dijawab oleh seorang frequentist seorang subjektivis Bayesian juga dapat menjawab dengan cara yang sama, atau dalam beberapa cara lain mereka harus memilih prior yang berbeda. ;Hai)

Dikran Marsupial
sumber
4
Penggunaan "subjektif Bayesian" adalah sedikit sabotase diri ( lihat ). Pemodelan secara umum penuh dengan subjektivisme, pilihan distribusi untuk pemodelan sampel juga subjektif. Bahkan pilihan uji goodness of fit untuk memeriksa apakah model tertentu masuk akal adalah subyektif.
2
Saya tidak benar-benar setuju dengan itu, jika seseorang menganggap "subyektif" sebagai sumpah serapah, itu adalah kesalahan mereka. Kadang-kadang ketika kita maksudkan probabilitas, kita benar-benar berarti kepercayaan pribadi subjektif - saya tidak melihat alasan untuk tidak menyebutnya bahwa jika itu yang sebenarnya dimaksudkan (memilih untuk hanya menerima frekuensi jangka panjang karena definisi probabilitas adalah pilihan murni subjektif).
Dikran Marsupial
1
Terima kasih +1 atas tautannya, ini sangat mencerahkan. Dan juga untuk catatan tentang perbedaan antara interval kepercayaan dan kredibel juga.
Mehrdad
8

Saya percaya makalah ini memberikan arti yang lebih terarah dari trade-off dalam aplikasi aktual antara keduanya. Sebagian dari ini mungkin karena preferensi saya untuk interval daripada tes.

Gustafson, P. dan Greenland, S. (2009). Estimasi Interval untuk Data Observasi Berantakan . Ilmu Statistik 24: 328-342.

Berkenaan dengan interval, mungkin ada baiknya untuk diingat bahwa interval kepercayaan frequentist memerlukan / menuntut cakupan yang seragam (tepat atau setidaknya besar dari x% untuk setiap dan setiap nilai parameter yang tidak memiliki probabilitas nol) dan jika mereka tidak memilikinya - mereka tidak benar-benar interval kepercayaan. (Beberapa akan melangkah lebih jauh dan mengatakan bahwa mereka juga harus mengesampingkan himpunan bagian yang relevan yang mengubah cakupan.)

Cakupan Bayesian biasanya didefinisikan dengan melonggarkan bahwa untuk "cakupan rata-rata" mengingat asumsi sebelumnya ternyata benar. Gustafson dan Greenland (2009) menyebut prior prima yang mahakuasa ini dan mempertimbangkan yang bisa salah untuk memberikan penilaian yang lebih baik.

phaneron
sumber
1
+1 Saya tidak pernah tahu tentang perbedaan pembatasan ini, terima kasih telah menunjukkannya.
Mehrdad
3

Jika seseorang mengajukan pertanyaan yang memiliki jawaban yang sering dan Bayesian, saya curiga bahwa orang lain akan dapat mengidentifikasi ambiguitas dalam pertanyaan, sehingga membuatnya tidak "terbentuk dengan baik".

Dengan kata lain, jika Anda membutuhkan jawaban yang sering, gunakan metode yang sering. Jika Anda membutuhkan jawaban Bayesian, gunakan metode Bayesian. Jika Anda tidak tahu mana yang Anda butuhkan, maka Anda mungkin tidak mendefinisikan pertanyaan dengan jelas.

Namun, di dunia nyata sering ada beberapa cara berbeda untuk mendefinisikan masalah atau mengajukan pertanyaan. Terkadang tidak jelas cara mana yang lebih disukai. Ini sangat umum ketika klien seseorang secara statistik naif. Di lain waktu satu pertanyaan jauh lebih sulit dijawab daripada yang lain. Dalam kasus-kasus seperti itu, orang sering kali menjawab yang paling mudah sambil berusaha memastikan kliennya setuju dengan pertanyaan apa yang ia ajukan atau masalah apa yang sedang ia selesaikan.

Emil Friedman
sumber
3

Saya merekomendasikan untuk melihat Latihan 3.15 dari Teori Informasi, Inferensi, dan Algoritma Pembelajaran yang tersedia secara bebas oleh MacKay.

Ketika berputar di tepi 250 kali, koin satu euro Belgia muncul kepala 140 kali dan ekor 110. "Itu terlihat sangat mencurigakan bagi saya," kata Barry Blight, seorang dosen statistik di London School of Economics. `Jika koin itu tidak bias peluang untuk mendapatkan hasil yang ekstrim seperti itu akan kurang dari 7% '. Tetapi apakah data ini memberikan bukti bahwa koin itu bias daripada adil?

hal0,076:1

Flounderer
sumber