Bayesian dan penalaran yang sering dilakukan dalam bahasa Inggris

341

Bagaimana Anda menjelaskan dalam bahasa Inggris biasa karakteristik yang membedakan penalaran Bayesian dari Frequentist?

Daniel Vassallo
sumber
Pertanyaan ini tentang menggambar kesimpulan tentang pemain mangkuk individu ketika Anda memiliki dua set data - hasil pemain lain, dan hasil pemain baru, adalah contoh spontan yang baik dari perbedaan yang coba saya jawab untuk menjawab dalam bahasa Inggris.
Peter Ellis
4
Mungkin beberapa dari Anda, orang-orang baik, juga dapat menyumbangkan jawaban untuk pertanyaan tentang interpretasi Bayesian dan sering yang ditanyakan di filsafat.stackexchange.com .
Drux

Jawaban:

198

Inilah cara saya menjelaskan perbedaan mendasar kepada nenek saya:

Saya salah meletakkan telepon saya di suatu tempat di rumah. Saya dapat menggunakan pencari lokasi telepon di dasar instrumen untuk mencari lokasi telepon dan ketika saya menekan pencari telepon, telepon mulai berbunyi bip.

Masalah: Area mana di rumah saya yang harus saya cari?

Penalaran Sering

Saya dapat mendengar telepon berbunyi. Saya juga memiliki model mental yang membantu saya mengidentifikasi area dari mana suara itu berasal. Karena itu, setelah mendengar bunyi bip, saya menyimpulkan daerah rumah saya, saya harus mencari untuk menemukan telepon.

Bayesian Reasoning

Saya dapat mendengar telepon berbunyi. Sekarang, terlepas dari model mental yang membantu saya mengidentifikasi area dari mana suara itu berasal, saya juga tahu lokasi di mana saya salah meletakkan telepon di masa lalu. Jadi, saya menggabungkan kesimpulan saya menggunakan bunyi bip dan informasi saya sebelumnya tentang lokasi saya salah meletakkan telepon di masa lalu untuk mengidentifikasi area yang harus saya cari untuk menemukan telepon.

Flimzy
sumber
11
Saya suka analoginya. Saya akan merasa sangat berguna jika ada pertanyaan yang didefinisikan (berdasarkan dataset) di mana jawaban diturunkan menggunakan penalaran yang sering dan jawaban diturunkan menggunakan Bayesian - lebih disukai dengan skrip R untuk menangani kedua penalaran. Apakah saya terlalu banyak bertanya?
Farrel
15
Hal paling sederhana yang dapat saya pikirkan adalah melempar koin n kali dan memperkirakan probabilitas kepala (dilambangkan dengan p). Misalkan, kita amati kepala k. Maka probabilitas mendapatkan k head adalah: P (k head dalam n percobaan) = (n, k) p ^ k (1-p) ^ (nk) Kesimpulan yang sering akan memaksimalkan hal di atas untuk sampai pada perkiraan p = k / n. Bayesian akan berkata: Hei, saya tahu bahwa p ~ Beta (1,1) (yang setara dengan mengasumsikan bahwa p adalah seragam pada [0,1]). Jadi, inferensi yang diperbarui adalah: p ~ Beta (1 + k, 1 + nk) dan dengan demikian perkiraan bayesian p akan menjadi p = 1 + k / (2 + n) Saya tidak tahu R, maaf.
41
Harus ditunjukkan bahwa, dari sudut pandang sering, tidak ada alasan bahwa Anda tidak dapat memasukkan pengetahuan sebelumnya ke dalam model. Dalam hal ini, tampilan sering lebih sederhana, Anda hanya memiliki model dan beberapa data. Tidak perlu memisahkan informasi sebelumnya dari model.
Robby McKilliam
1
@ user28 Sebagai komentar pada komentar Anda, jika , maka frequentist akan memperkirakan (masing-masing ) setelah melihat hasil dari head (masing-masing head), yaitu, koin adalah berkepala dua atau berekor dua. Perkiraan Bayesian masing-masing dan memungkinkan untuk kemungkinan bahwa itu adalah koin yang agak kurang bias. p = 0 p = 1 k = 0 k = 3 1 / 5 4 / 5n=3p=0p=1k=0k=31/54/5
Dilip Sarwate
3
@ BYS2 Bahasa pemrograman disebut R.
user1205901
104

Lidah tegas di pipi:

Bayesian mendefinisikan "probabilitas" dengan cara yang persis sama dengan yang dilakukan sebagian besar non-ahli statistik - yaitu indikasi kemungkinan masuknya suatu proposisi atau situasi. Jika Anda mengajukan pertanyaan kepadanya, ia akan memberi Anda jawaban langsung yang memberikan probabilitas yang menjelaskan kemungkinan hasil yang mungkin untuk situasi tertentu (dan nyatakan asumsi sebelumnya).

Seorang Frequentist adalah seseorang yang percaya probabilitas mewakili frekuensi jangka panjang yang dengannya peristiwa terjadi; jika perlu, ia akan menciptakan populasi fiktif yang darinya situasi khusus Anda dapat dianggap sebagai sampel acak sehingga ia dapat berbicara secara bermakna tentang frekuensi jangka panjang. Jika Anda mengajukan pertanyaan kepadanya tentang situasi tertentu, dia tidak akan memberikan jawaban langsung, melainkan membuat pernyataan tentang populasi (kemungkinan imajiner) ini. Banyak ahli statistik non-sering akan dengan mudah bingung dengan jawaban dan menafsirkannya sebagai probabilitas Bayesian tentang situasi tertentu.

Namun, penting untuk dicatat bahwa sebagian besar metode Frequentist memiliki padanan Bayesian yang dalam kebanyakan keadaan pada dasarnya akan memberikan hasil yang sama, perbedaannya sebagian besar adalah masalah filosofi, dan dalam praktiknya itu adalah masalah "kuda untuk kursus".

Seperti yang mungkin sudah Anda duga, saya seorang Bayesian dan seorang insinyur. ;Hai)

Dikran Marsupial
sumber
36
Sebagai non-ahli, saya pikir kunci dari seluruh perdebatan adalah bahwa orang-orang benar-benar beralasan seperti orang Bayes. Anda harus dilatih untuk berpikir seperti orang yang sering, dan meskipun begitu mudah tergelincir dan entah alasan atau menyajikan alasan Anda seolah-olah itu adalah Bayesian. "Ada kemungkinan 95% bahwa nilainya berada dalam interval kepercayaan ini." Cukup kata.
Wayne
8
Kuncinya juga adalah untuk berpikir tentang jenis lobi apa yang membuat statistik abad ke-20 disebut "klasik" sedangkan statistik yang mulai digunakan Laplace dan Gauss pada abad ke-19 tidak ...
gwr
3
Mungkin saya sudah terlalu sering melakukan pekerjaan, tetapi saya tidak begitu yakin sudut pandang Bayesian selalu intuitif. Misalnya, anggap saya tertarik pada parameter minat dunia nyata, seperti tinggi rata-rata populasi. Jika saya memberi tahu Anda "ada 95% kemungkinan parameter bunga dalam interval kredibel saya", dan kemudian lanjutkan dengan pertanyaan "Jika kami membuat 100 interval seperti itu untuk parameter yang berbeda, berapa proporsi dari mereka yang kami harapkan mengandung nilai sebenarnya dari parameter? ", fakta bahwa jawabannya tidak 95 pasti membingungkan bagi sebagian orang.
Cliff AB
4
@CliffAB tetapi mengapa Anda menanyakan pertanyaan kedua? Intinya adalah mereka adalah pertanyaan yang berbeda, sehingga tidak mengherankan bahwa mereka memiliki jawaban yang berbeda. Baysian dapat menjawab kedua pertanyaan, tetapi jawabannya mungkin berbeda (yang menurut saya masuk akal). Frequentist hanya dapat menjawab salah satu pertanyaan (karena definisi probabilitas terbatas) dan karenanya (secara implisit) menggunakan jawaban yang sama untuk kedua pertanyaan, yang menjadi penyebab masalah. Interval kredibel bukan interval kepercayaan, tetapi Bayesian dapat membangun kedua interval kredibel dan interval kepercayaan.
Dikran Marsupial
4
Komentar saya adalah tanggapan terhadap komentar Wayne; gagasan bahwa orang "secara alami" berpikir dalam konteks Bayesian, karena lebih mudah untuk menafsirkan interval yang kredibel. Maksud saya adalah bahwa sementara itu lebih mudah untuk membangun interpretasi yang tepat dari interval yang kredibel (yaitu kurang dari sup kata), saya pikir non-ahli statistik juga cenderung bingung tentang apa yang sebenarnya berarti.
Cliff AB
64

Sangat kasar saya akan mengatakan bahwa:

Frequentist: Pengambilan sampel tidak terbatas dan aturan keputusan bisa tajam. Data adalah sampel acak berulang - ada frekuensi. Parameter yang mendasarinya tetap yaitu mereka tetap konstan selama proses pengambilan sampel berulang ini.

Bayesian: Jumlah yang tidak diketahui diperlakukan secara probabilistik dan keadaan dunia selalu dapat diperbarui. Data diamati dari sampel yang direalisasikan. Parameter tidak diketahui dan dijelaskan secara probabilistik. Ini adalah data yang diperbaiki.

Ada posting blog yang brilian yang memberikan contoh mendalam tentang bagaimana Bayesian dan Frequentist akan mengatasi masalah yang sama. Mengapa tidak menjawab sendiri masalahnya lalu periksa?

Masalahnya (diambil dari blog Panos Ipeirotis '):

Anda memiliki koin yang ketika terbalik berakhir dengan probabilitas p dan berakhir dengan probabilitas 1-p. (Nilai p tidak diketahui.)

Mencoba memperkirakan p, Anda membalik koin 100 kali. Itu berakhir kepala 71 kali.

Maka Anda harus memutuskan acara berikut: "Dalam dua lemparan berikutnya kita akan mendapatkan dua kepala berturut-turut."

Apakah Anda bertaruh bahwa peristiwa itu akan terjadi atau itu tidak akan terjadi?

Graham Cookson
sumber
6
Karena , saya akan menganggap ini sebagai cukup dekat untuk taruhan genap untuk dipersiapkan dengan cara sederhana hanya untuk bersenang-senang (dan untuk mengabaikan masalah apa pun atas bentuk sebelumnya). Saya terkadang membeli tiket asuransi dan lotre dengan peluang yang jauh lebih buruk. 0.712=0.5041
Henry
5
Pada akhir posting blog itu tertulis "daripada menggunakan distribusi seragam sebagai sebelumnya, kita bisa menjadi lebih agnostik. Dalam hal ini, kita dapat menggunakan distribusi Beta (0,0) sebagai pendahulunya. Distribusi seperti itu sesuai untuk kasus di mana setiap mean dari distribusi sama-sama mungkin. Dalam kasus ini, dua pendekatan, Bayesian dan frequentist memberikan hasil yang sama. " jenis apa yang meringkasnya benar-benar!
tdc
13
Masalah besar dengan posting blog itu adalah tidak cukup mencirikan apa yang akan dilakukan oleh pembuat keputusan non-Bayesian (tapi rasional). Ini sedikit lebih dari manusia jerami.
whuber
1
@tdc: sebelumnya Bayesian (Jeffreys) adalah Beta (0,5, 0,5) dan beberapa akan mengatakan bahwa itu adalah satu-satunya yang sebelumnya dapat dibenarkan.
Neil G
1
@ mcb - tepat
digitgopher
42

Katakanlah seorang lelaki menggulung dadu bersisi enam dan hasilnya 1, 2, 3, 4, 5, atau 6. Lebih lanjut, dia mengatakan bahwa jika mendarat pada angka 3, dia akan memberi Anda buku teks gratis.

Kemudian secara informal:

The Frequentist akan mengatakan bahwa setiap hasil memiliki peluang yang sama dengan 1 dalam 6 terjadi. Dia memandang probabilitas berasal dari distribusi frekuensi jangka panjang.

The Bayesian namun akan mengatakan menggantung pada kedua, saya tahu orang itu, dia David Blaine, penipu terkenal! Aku punya perasaan dia merencanakan sesuatu. Saya akan mengatakan bahwa hanya ada 1% peluangnya untuk mendarat di 3 TETAPI saya akan mengevaluasi kembali kepercayaan itu dan mengubahnya semakin sering dia menggulingkan dadu. Jika saya melihat angka-angka lain muncul sama seringnya, maka saya akan meningkatkan kesempatan dari 1% menjadi sesuatu yang sedikit lebih tinggi, jika tidak saya akan mengurangi itu lebih jauh. Dia memandang probabilitas sebagai tingkat kepercayaan pada proposisi.

Tony Breyal
sumber
24
Saya pikir frequentist akan (secara verbal) menunjukkan asumsinya dan akan menghindari membuat prediksi yang berguna. Mungkin dia akan berkata, "Dengan anggapan bahwa mati itu adil, setiap hasil memiliki peluang yang sama dalam 1 dari 6 terjadi. Selanjutnya, jika gulungan mati adil dan David Blaine melempar mati sebanyak 17 kali, hanya ada peluang 5% bahwa itu tidak akan pernah mendarat pada 3, sehingga hasil seperti itu akan membuat saya ragu bahwa mati itu adil. "
Thomas Levine
Jadi apakah "kemungkinan" (seperti dalam MLE) akan menjadi "probabilitas" yang sering terjadi?
Akababa
40

Hanya sedikit bersenang-senang ...

Bayesian adalah orang yang, secara samar mengharapkan seekor kuda, dan melihat keledai sekilas, sangat percaya dia telah melihat seekor keledai.

Dari situs ini:

http://www2.isye.gatech.edu/~brani/isyebayes/jokes.html

dan dari situs yang sama, esai yang bagus ...

"Penjelasan Intuitif Teorema Bayes"

http://yudkowsky.net/rational/bayes

Brett
sumber
14
Dalam hal ini, yang tidak akan sering menjadi orang yang tahu rasio populasi keledai, keledai dan kuda, dan setelah mengamati sebungkus keledai mulai menghitung nilai p untuk mengetahui apakah ada peningkatan yang signifikan secara statistik dalam rasio populasi bagal.
Andrew
30

Bayesian diminta untuk membuat taruhan, yang mungkin termasuk apa pun dari mana terbang akan merangkak ke dinding lebih cepat yang obatnya akan menyelamatkan sebagian besar nyawa, atau tahanan mana yang harus masuk penjara. Dia memiliki kotak besar dengan pegangan. Dia tahu bahwa jika dia benar-benar memasukkan semua yang dia tahu ke dalam kotak, termasuk pendapat pribadinya, dan mengubah pegangannya, itu akan membuat keputusan terbaik untuknya.

Sering kali diminta untuk menulis laporan. Dia memiliki buku peraturan besar yang hitam. Jika situasi ia diminta untuk membuat laporan dicakup oleh buku peraturannya, ia dapat mengikuti aturan dan menulis laporan dengan sangat hati-hati sehingga salah, paling buruk, satu kali dalam 100 (atau satu kali dalam 20, atau satu waktu dalam apa pun spesifikasi untuk laporannya mengatakan).

Orang yang sering tahu (karena dia telah menulis laporannya) bahwa orang Bayesian kadang-kadang membuat taruhan bahwa, dalam kasus terburuk, ketika pendapat pribadinya salah, bisa berubah menjadi buruk. Si frequentist juga tahu (untuk alasan yang sama) bahwa jika dia bertaruh melawan Bayesian setiap kali dia berbeda darinya, maka, dalam jangka panjang, dia akan kalah.

McDowella
sumber
"dalam jangka panjang, dia akan kalah" adalah ambigu. Saya berasumsi 'dia' adalah bayesian di sini? Bukankah mereka akan menyamai dalam jangka panjang - bayesian bisa belajar dan mengubah pendapat pribadinya sampai cocok dengan fakta aktual (tetapi tidak diketahui).
lucidbrot
26

Dalam bahasa Inggris yang sederhana, saya akan mengatakan bahwa penalaran Bayesian dan Frequentist dibedakan oleh dua cara berbeda untuk menjawab pertanyaan:

Apa itu probabilitas?

Sebagian besar perbedaan pada dasarnya akan menjadi bagaimana masing-masing menjawab pertanyaan ini, karena pada dasarnya mendefinisikan domain aplikasi teori yang valid. Sekarang Anda tidak dapat benar-benar memberikan jawaban dalam "bahasa Inggris biasa", tanpa menghasilkan lebih banyak pertanyaan. Bagi saya jawabannya adalah (karena Anda mungkin bisa menebak)

probabilitas adalah logika

"Non-plain english" alasan saya untuk ini adalah bahwa kalkulus proposisi adalah kasus khusus kalkulus probabilitas, jika kita merepresentasikan kebenaran sebesar dan kepalsuan sebesar0 110. Selain itu, kalkulus probabilitas dapat diturunkan dari kalkulus proposisi. Ini sesuai dengan penalaran "bayesian" paling dekat - meskipun itu juga memperluas penalaran bayesian dalam aplikasi dengan memberikan prinsip untuk menetapkan probabilitas, di samping prinsip untuk memanipulasi mereka. Tentu saja, ini mengarah pada pertanyaan lanjutan "apa itu logika?" bagi saya, hal terdekat yang bisa saya berikan sebagai jawaban untuk pertanyaan ini adalah "logika adalah penilaian akal sehat dari orang yang rasional, dengan seperangkat asumsi yang diberikan" (apa yang orang yang rasional? dll. dll). Logika memiliki semua fitur yang sama dengan yang dimiliki Bayesian. Misalnya, logika tidak memberi tahu Anda apa yang harus diasumsikan atau apa yang "mutlak benar". Itu hanya memberi tahu Anda bagaimana kebenaran satu proposisi terkait dengan kebenaran yang lain. Anda selalu harus menyediakan sistem logis dengan "aksioma" untuk memulai kesimpulan. Mereka juga memiliki keterbatasan yang sama dalam hal Anda bisa mendapatkan hasil yang sewenang-wenang dari aksioma yang saling bertentangan. Tetapi "aksioma" tidak lain adalah probabilitas sebelumnya yang telah ditetapkan1 . Bagi saya, menolak penalaran Bayesian berarti menolak logika. Karena jika Anda menerima logika, maka karena penalaran Bayesian "secara logis mengalir dari logika" (bagaimana dengan bahasa Inggris: P), Anda juga harus menerima penalaran Bayesian.

Untuk alasan yang sering, kami punya jawabannya:

probabilitas adalah frekuensi

walaupun saya tidak yakin "frekuensi" adalah istilah bahasa Inggris yang biasa digunakan dalam istilah ini - mungkin "proporsi" adalah kata yang lebih baik. Saya ingin menambahkan jawaban yang sering bahwa kemungkinan suatu peristiwa dianggap sebagai kuantitas yang nyata, dapat diukur (dapat diamati?), Yang ada secara independen dari orang / objek yang menghitungnya. Tetapi saya tidak bisa melakukan ini dengan cara "bahasa Inggris biasa".

Jadi mungkin versi "bahasa Inggris biasa" dari satu perbedaan bisa jadi bahwa penalaran yang sering adalah upaya untuk menalar dari probabilitas "absolut", sedangkan penalaran bayesian adalah upaya untuk menalar dari probabilitas "relatif".

Perbedaan lain adalah bahwa fondasi frequentist lebih kabur dalam cara Anda menerjemahkan masalah dunia nyata ke dalam matematika abstrak dari teori tersebut. Contoh yang baik adalah penggunaan "variabel acak" dalam teori - mereka memiliki definisi yang tepat dalam dunia abstrak matematika, tetapi tidak ada prosedur jelas yang dapat digunakan untuk memutuskan apakah beberapa kuantitas yang diamati adalah atau tidak "acak" variabel".

Cara berpikir bayesian, gagasan "variabel acak" tidak diperlukan. Distribusi probabilitas ditetapkan ke kuantitas karena tidak diketahui - yang berarti tidak dapat disimpulkan secara logis dari informasi yang kami miliki. Ini sekaligus memberikan koneksi sederhana antara kuantitas yang dapat diamati dan teori - karena "tidak diketahui" tidak ambigu.

Anda juga dapat melihat dalam contoh di atas perbedaan lebih lanjut dalam dua cara berpikir ini - "acak" vs "tidak dikenal". "keacakan" diutarakan sedemikian rupa sehingga "keacakan" tampak seperti itu adalah properti dari kuantitas aktual. Sebaliknya, "menjadi tidak diketahui" tergantung pada orang yang Anda tanyakan tentang jumlah itu - karena itu merupakan properti ahli statistik yang melakukan analisis. Ini menimbulkan kata sifat "obyektif" versus "subyektif" yang sering dikaitkan dengan setiap teori. Mudah untuk menunjukkan bahwa "keacakan" tidak dapat menjadi properti dari beberapa contoh standar, dengan hanya meminta dua orang yang sering diberi informasi berbeda tentang jumlah yang sama untuk memutuskan apakah "acak". Salah satunya adalah Bernoulli Urn yang biasa: frequentist 1 ditutup matanya saat menggambar, sedangkan frequentist 2 berdiri di atas guci, menonton frequentist 1 menarik bola dari guci. Jika deklarasi "keacakan" adalah properti dari bola di guci, maka itu tidak dapat bergantung pada pengetahuan yang berbeda dari frequentist 1 dan 2 - dan karenanya dua frequentist harus memberikan deklarasi yang sama "acak" atau "tidak acak" .

probabilityislogic
sumber
3
Saya akan tertarik jika Anda bisa menulis ulang ini tanpa mengacu pada akal sehat.
Peter Ellis
@PeterEllis - Apa yang salah dengan akal sehat? Kita semua memilikinya, dan biasanya bodoh untuk tidak menggunakannya ...
probabilityislogic
13
Itu terlalu diperdebatkan apa itu sebenarnya, dan terlalu spesifik secara budaya. "Akal sehat" adalah kependekan dari apa pun yang dianggap sebagai cara yang masuk akal untuk melakukan sesuatu dalam budaya tertentu ini (yang terlalu sering terlihat jauh dari masuk akal ke budaya lain dalam ruang dan waktu), jadi merujuk pada definisi definisi bebek pertanyaan kunci . Ini sangat tidak membantu sebagai bagian dari definisi logika (dan saya berpendapat, adalah konsep "orang rasional" dalam konteks tertentu - terutama karena saya menebak definisi Anda tentang "orang rasional" akan menjadi orang yang logis) yang memiliki akal sehat!)
Peter Ellis
4
Dia tidak dapat memberikan satu, argumennya adalah bahwa tidak ada definisi universal , hanya yang spesifik secara budaya. Dua orang dari latar belakang budaya yang berbeda (dan itu termasuk gaya pendidikan statistik yang berbeda) sangat mungkin memiliki dua pemahaman yang berbeda tentang apa yang masuk akal untuk dilakukan dalam situasi tertentu.
naught101
2
Jawaban ini memiliki nugget kebaikan (bagaimana itu untuk bahasa Inggris biasa?), Tapi saya tidak percaya (bagaimana itu menjadi seorang Bayesian!) Bahwa pernyataan berikut ini benar: "Karena jika Anda menerima logika ... Anda juga harus menerima Alasan Bayesian ". Misalnya, jika Anda berpikir alih-alih menerjemahkan teori abstrak matematika ke dalam dunia nyata, Anda akan menemukan bahwa pendekatan aksiomatik dapat konsisten dengan penalaran Frequentist dan Bayesian! Dapat diperdebatkan, Kolmogorov dalam kasus pertama, dan, katakanlah, Jeffreys dalam kasus kedua. Intinya, teori probabilitas itulah yang logis; bukan interpretasinya.
Graeme Walsh
21

Pada kenyataannya, saya pikir banyak dari filosofi di sekitar masalah ini hanya luar biasa. Itu bukan untuk menolak debat, tapi itu kata peringatan. Terkadang, masalah praktis diprioritaskan - Saya akan memberikan contoh di bawah ini.

Anda juga dapat dengan mudah berargumen bahwa ada lebih dari dua pendekatan:

  • Neyman-Pearson ('sering')
  • Pendekatan berbasis kemungkinan
  • Sepenuhnya Bayesian

Seorang kolega senior baru-baru ini mengingatkan saya bahwa "banyak orang dalam bahasa yang sama berbicara tentang frequentist dan Bayesian. Saya pikir perbedaan yang lebih valid adalah berdasarkan kemungkinan dan sering. Baik kemungkinan maksimum dan metode Bayes mematuhi prinsip kemungkinan sedangkan metode frequentist tidak. "

Saya akan mulai dengan contoh praktis yang sangat sederhana:

Kami punya pasien. Pasien sehat (H) atau sakit (S). Kami akan melakukan tes pada pasien, dan hasilnya akan positif (+) atau negatif (-). Jika pasien sakit, mereka akan selalu mendapatkan hasil yang positif. Kami akan menyebut ini hasil yang benar (C) dan mengatakan bahwa atau Jika pasien sehat, tes akan negatif 95% dari waktu, tetapi ada akan ada beberapa positif palsu. Dalam karya lain, probabilitas tes menjadi Benar, untuk orang sehat, adalah 95%.P ( C o r r e c t | S ) = 1 P ( - | H ) = 0,95 P ( + | H ) = 0,05

P(+|S)=1
P(Correct|S)=1
P(|H)=0.95
P(+|H)=0.05

Jadi, tes ini 100% akurat atau 95% akurat, tergantung pada apakah pasien sehat atau sakit. Secara keseluruhan, ini berarti tes ini setidaknya 95% akurat.

Sejauh ini bagus. Itu adalah pernyataan yang akan dibuat oleh frequentist. Pernyataan-pernyataan itu cukup sederhana untuk dipahami dan benar. Tidak perlu bingung tentang 'interpretasi yang sering'.

Tapi, hal-hal menjadi menarik ketika Anda mencoba membalikkan keadaan. Mengingat hasil tes, apa yang dapat Anda pelajari tentang kesehatan pasien? Dengan hasil tes negatif, pasien jelas sehat, karena tidak ada negatif palsu.

Tetapi kita juga harus mempertimbangkan kasus di mana tesnya positif. Apakah tes positif karena pasien benar-benar sakit, atau apakah itu positif palsu? Di sinilah sering dan Bayesian berbeda. Semua orang akan setuju bahwa ini tidak dapat dijawab saat ini. Sering akan menolak untuk menjawab. Bayesian akan siap untuk memberi Anda jawaban, tetapi Anda harus memberi Bayesian terlebih dahulu - yaitu mengatakan proporsi pasien yang sakit.

Untuk rekap, pernyataan berikut ini benar:

  • Untuk pasien yang sehat, tes ini sangat akurat.
  • Untuk pasien yang sakit, tes ini sangat akurat.

Jika Anda puas dengan pernyataan seperti itu, maka Anda menggunakan interpretasi yang sering. Ini mungkin berubah dari proyek ke proyek, tergantung pada jenis masalah apa yang Anda lihat.

Tetapi Anda mungkin ingin membuat pernyataan yang berbeda dan menjawab pertanyaan berikut:

  • Bagi pasien yang mendapat hasil tes positif, seberapa akurat tes itu?

Ini membutuhkan pendekatan prior dan Bayesian. Perhatikan juga bahwa ini adalah satu-satunya pertanyaan yang menarik bagi dokter. Dokter akan berkata "Saya tahu bahwa pasien akan mendapatkan hasil positif atau hasil negatif. Saya juga sekarang bahwa hasil negatif berarti pasien sehat dan dapat dikirim pulang. Satu-satunya pasien yang menarik minat saya sekarang adalah mereka yang mendapat hasil positif - apakah mereka sakit? "

Untuk meringkas: Dalam contoh seperti ini, Bayesian akan setuju dengan semua yang dikatakan oleh frequentist. Tetapi Bayesian akan berpendapat bahwa pernyataan frequentist, meskipun benar, tidak terlalu berguna; dan akan berpendapat bahwa pertanyaan yang berguna hanya dapat dijawab dengan sebelumnya.

Seorang frequentist akan mempertimbangkan setiap nilai yang mungkin dari parameter (H atau S) pada gilirannya dan bertanya "jika parameternya sama dengan nilai ini, berapakah probabilitas pengujian saya benar?"

Sebaliknya, seorang Bayesian akan mempertimbangkan setiap nilai yang mungkin diamati (+ atau -) dan bertanya, "Jika saya bayangkan saya baru saja mengamati nilai itu, apa yang saya katakan tentang probabilitas bersyarat H-versus-S?"

Aaron McDaid
sumber
1
Apakah maksud For sick patients, the test is NOT very accurate.Anda Anda melupakan TIDAK?
agstudy
1
Ini sangat akurat dalam kedua kasus, jadi tidak, saya tidak lupa sepatah kata pun. Untuk orang sehat, hasilnya akan benar (yaitu 'Negatif') 95% dari waktu. Dan untuk orang sakit, hasilnya akan benar (yaitu 'Positif') 95% dari waktu.
Aaron McDaid
Saya pikir "kelemahan" dalam kemungkinan maksimum adalah bahwa ia mengasumsikan seragam sebelum data sedangkan "Bayesian penuh" lebih fleksibel dalam apa yang sebelumnya dapat Anda pilih.
Joe Z.
Untuk melengkapi contoh, anggaplah 0,1% dari populasi sakit dengan penyakit D yang sedang kami uji: ini bukan prioritas kami. Lebih mungkin, sekitar 30% pasien yang datang ke dokter dan memiliki gejala yang cocok dengan D sebenarnya memiliki D (ini bisa lebih atau kurang tergantung pada rincian seperti seberapa sering penyakit yang berbeda muncul dengan gejala yang sama). Jadi 70% dari mereka yang mengikuti tes itu sehat, 66,5% mendapat hasil negatif, dan 30% / 33,5% sakit. Jadi diberi hasil positif, probabilitas posterior kami bahwa seorang pasien sakit adalah 89,6%. Teka-teki berikutnya: bagaimana kita tahu bahwa 70% peserta tes memiliki D?
Qwertie
7

Statistik Bayesian dan frequentist kompatibel karena dapat dipahami sebagai dua kasus pembatas dalam menilai probabilitas kejadian di masa depan berdasarkan peristiwa masa lalu dan model yang diasumsikan, jika seseorang mengakui bahwa dalam batas jumlah pengamatan yang sangat besar, tidak ada ketidakpastian tentang sistem tetap ada, dan dalam hal ini sejumlah besar pengamatan sama dengan mengetahui parameter model.

Anggaplah kita telah melakukan beberapa pengamatan, misalnya, hasil 10 koin terbalik. Dalam statistik Bayesian, Anda mulai dari apa yang telah Anda amati dan kemudian Anda menilai probabilitas pengamatan di masa depan atau parameter model. Dalam statistik frequentist, Anda mulai dari ide (hipotesis) tentang apa yang benar dengan mengasumsikan skenario sejumlah besar pengamatan yang telah dilakukan, misalnya, koin tidak bias dan memberikan 50% kepala ke atas, jika Anda melemparkannya berkali-kali. Berdasarkan pada skenario sejumlah besar pengamatan ini (= hipotesis), Anda menilai frekuensi melakukan pengamatan seperti yang Anda lakukan, yaitu, frekuensi hasil yang berbeda dari 10 flips koin. Hanya saat itulah Anda mengambil hasil aktual Anda, membandingkannya dengan frekuensi kemungkinan hasil, dan memutuskan apakah hasilnya milik mereka yang diharapkan terjadi dengan frekuensi tinggi. Jika demikian, Anda berkesimpulan bahwa pengamatan yang dilakukan tidak bertentangan dengan skenario Anda (= hipotesis). Jika tidak, Anda menyimpulkan bahwa pengamatan yang dilakukan tidak sesuai dengan skenario Anda, dan Anda menolak hipotesis.

Dengan demikian, statistik Bayesian dimulai dari apa yang telah diamati dan menilai kemungkinan hasil di masa depan. Statistik Frequentist dimulai dengan eksperimen abstrak tentang apa yang akan diamati jika seseorang mengasumsikan sesuatu, dan hanya kemudian membandingkan hasil eksperimen abstrak dengan apa yang sebenarnya diamati. Kalau tidak, kedua pendekatan tersebut kompatibel. Mereka berdua menilai probabilitas pengamatan di masa depan berdasarkan beberapa pengamatan yang dibuat atau dihipotesiskan.

Saya mulai menulis ini dengan cara yang lebih formal:

Memposisikan inferensi Bayesian sebagai aplikasi khusus inferensi frequentist dan sebaliknya. figshare.

http://dx.doi.org/10.6084/m9.figshare.867707

Naskah itu baru. Jika Anda membacanya, dan memiliki komentar, harap beri tahu saya.

pengguna36160
sumber
6

Saya akan mengatakan bahwa mereka melihat probabilitas dalam berbagai cara. Bayesian bersifat subyektif dan menggunakan keyakinan apriori untuk menentukan distribusi probabilitas sebelumnya pada nilai yang mungkin dari parameter yang tidak diketahui. Jadi dia bergantung pada teori probabilitas seperti deFinetti. Orang yang sering melihat probabilitas sebagai sesuatu yang berkaitan dengan frekuensi terbatas berdasarkan proporsi yang diamati. Ini sejalan dengan teori probabilitas yang dikembangkan oleh Kolmogorov dan von Mises.
Seorang frequentist melakukan inferensi parametrik hanya dengan menggunakan fungsi kemungkinan. Bayesian mengambilnya dan mengalikannya dengan prior dan menormalkannya untuk mendapatkan distribusi posterior yang ia gunakan untuk inferensi.

Michael Chernick
sumber
4
+1 Jawaban yang baik, tetapi harus ditekankan bahwa pendekatan Bayesian dan pendekatan Frekuensi berbeda sehubungan dengan interpretasi probabilitas mereka. Kolmogorov, di sisi lain, memberikan landasan aksiomatik untuk teori probabilitas, yang tidak memerlukan interpretasi (!) Seperti yang digunakan oleh Bayesian atau Frequentist. Dalam arti tertentu, sistem aksiomatik memiliki kehidupannya sendiri! Dari enam aksioma Kolmogorov saja, saya tidak berpikir mungkin untuk mengatakan bahwa sistem aksiomatiknya adalah Bayesian atau Frequentist, dan, pada kenyataannya, bisa konsisten dengan keduanya.
Graeme Walsh
1

Cara saya menjawab pertanyaan ini adalah bahwa sering membandingkan data yang mereka lihat dengan apa yang mereka harapkan. Artinya, mereka memiliki model mental tentang seberapa sering sesuatu harus terjadi, dan kemudian melihat data dan seberapa sering itu terjadi. yaitu seberapa besar kemungkinan data yang telah mereka lihat mengingat model yang mereka pilih.

Orang Bayesian , di sisi lain, menggabungkan model mental mereka. Yaitu, mereka memiliki model berdasarkan pengalaman mereka sebelumnya yang memberi tahu mereka seperti apa data itu seharusnya, dan kemudian mereka menggabungkan ini dengan data yang mereka amati untuk didasarkan pada keyakinan " posterior". yaitu, mereka menemukan probabilitas model yang mereka pilih adalah valid mengingat data yang telah mereka amati.

Demetrios Papakostas
sumber
-2

Frequentist: Keadaan alam yang sebenarnya adalah. Jika saya terbiasa melakukan analisis seperti ini, 95% jawaban saya akan benar.

Bayesian: Ada kemungkinan 95% bahwa jawaban yang sebenarnya adalah .... Saya mendasarkan bahwa pada kombinasi data yang Anda berikan kepada saya dan tebakan kami sebelumnya tentang apa yang sebenarnya.

Emil M Friedman
sumber
-3

Frequentist: bertaruh pada dadu. Hanya nilai dadu yang akan menentukan hasilnya: Anda memenangkan taruhan atau tidak. Tergantung pada kesempatan saja.

Bayesian: bermain poker Texas Hold'em. Anda adalah satu-satunya yang melihat dua kartu Anda. Anda memiliki pengetahuan tentang pemain lain di atas meja. Anda harus menyesuaikan probabilitas Anda untuk menang di flop, turn, dan river dan mungkin tergantung pada pemain mana yang tersisa. Apakah mereka sering menggertak? Apakah mereka pemain yang agresif atau pasif? Semua ini akan memutuskan apa yang Anda lakukan. Bukan hanya probabilitas dua kartu pertama yang Anda dapatkan, yang akan memutuskan apakah Anda menang atau tidak.

Bermain poker sering berarti bahwa setiap pemain akan menunjukkan tangannya di awal dan kemudian bertaruh atau lipat sebelum kartu gagal, putar dan sungai ditampilkan. Sekarang hanya tergantung pada kesempatan lagi apakah Anda menang atau tidak.

ccrider
sumber
-5

Katakanlah, jika Anda sakit kepala dan pergi ke dokter. Misalkan, dalam set keputusan dokter ada dua penyebab sakit kepala, # 1 untuk tumor otak (penyebab utama yang menyebabkan sakit kepala 99% dari waktu), dan dingin # 2 (penyebab yang dapat menyebabkan sakit kepala pada beberapa pasien) .

Maka keputusan dokter berdasarkan pendekatan Frequentist adalah, Anda menderita tumor otak.

Keputusan dokter berdasarkan pendekatan Bayesian akan memberi tahu Anda, Anda menderita pilek (walaupun hanya 1% pilek menyebabkan sakit kepala)

Yang Fu
sumber
1
(-1) Tidak jelas apa perbedaan antara "Frequentist doc" dan "Bayesian doc". Saya tidak melihat alasan mengapa dokter Frequentist akan mengabaikan data tentang pilek yang menyebabkan sakit kepala. Bayesian doc tampaknya tidak menggunakan teorema Bayes atau prior, jadi saya tidak melihat bagaimana dia Bayesian?
Tim
Terlalu tidak masuk akal untuk menjadi analogi yang berguna atau bahkan menghibur.
Nick Cox
-6

Seekor kucing jantan dan seekor kucing betina dikurung di ruang baja, bersama dengan makanan dan air yang cukup selama 70 hari.

Seorang Frequentist akan mengatakan periode kehamilan rata-rata untuk kucing adalah 66 hari, betina dalam keadaan panas ketika kucing-kucing itu ditulisi, dan sekali dalam panas dia akan kawin berulang kali selama 4 hingga 7 hari. Karena kemungkinan ada banyak aksi propagasi dan cukup waktu untuk kehamilan berikutnya, kemungkinannya adalah, ketika kotak dibuka pada hari ke 70, ada banyak anak kucing yang baru lahir.

Seorang Bayesian akan berkata, saya mendengar Marvin Gaye yang serius datang dari kotak pada hari 1 dan kemudian pagi ini saya mendengar banyak suara seperti anak kucing yang datang dari kotak. Jadi tanpa mengetahui banyak tentang reproduksi kucing, kemungkinannya adalah, ketika kotak dibuka pada hari ke 70, ada sampah anak kucing yang baru lahir.

Singa
sumber
Cara saya menulisnya, khususnya dengan bayesian yang tidak tahu banyak tentang reproduksi kucing, pada awalnya hanya yang sering bertaruh di sana adalah anak kucing. Poin yang relevan dari contoh saya yang paling kasar kebanyakan adalah bahwa frequentist membuat prediksi berdasarkan data di awal, kemudian duduk kembali tanpa memasukkan data tambahan baru, sementara bayesian tidak memiliki banyak data untuk memulai, tetapi terus menggabungkan data yang relevan saat tersedia.
A Lion
3
... dan mengapa non-Bayesian memanfaatkan data tambahan itu juga?
whuber