Contoh-contoh penerapan teorema Bayes yang salah

Ya. Saya dipekerjakan sebagai konsultan statistik baru-baru ini untuk meneliti artikel (ly mengerikan) tertentu yang penulis berhasil membuat diri mereka terlihat lebih buruk dalam surat kepada editor menggunakan teorema Bayes. Mereka mulai dengan nilai prediksi positif salah hitung dari artikel mereka (PPV = 95% seharusnya). Mereka pada dasarnya mengabaikan surat kritis tentang hal ini oleh Ricci ^{₍₂₀₀₄₎} yang mencoba (dan gagal) untuk memberi tahu mereka bagaimana mereka seharusnya menghitungnya (ia menyarankan 82,3%). Kemudian mereka menemukan buku teks biostats ^{_{(Elston & Johnson, 1994)}} dan salah mengutipnya. Kami membeli buku itu dan memeriksa, tetapi kalau dipikir-pikir, ini sama tidak perlunya seperti yang saya duga. Dapatkan beban kekacauan ini (dari surat balasan Barsness et al. Kepada editor):

Teorema ¹ Bayes umumnya menyatakan bahwa prevalensi rendah penyakit tertentu (NAT) memperkuat nilai prediktif positif dari tes positif (patah tulang rusuk) untuk menentukan keadaan penyakit (korban NAT) ... Menurut teorema Bayes, ¹ probabilitas suatu kejadian didefinisikan oleh persamaan berikut: P adalah probabilitas dari kejadian yang benar ( korban NAT), P (S / D ₁ ) adalah probabilitas tes positif (PPV dari fraktur tulang rusuk untuk memprediksi NAT) dan P (S / D ₂ ) adalah probabilitas posterior dari tes positif (prevalensi NAT) . Mengganti data kami, probabilitas bahwa patah tulang rusuk adalah peristiwa sebenarnya
$P = \frac{P (S / D_{1})}{P (S / D_{1}) + P (S / D_{2})}$ $\rm P=\frac{P(S/D_1)}{P(S/D_1)+P(S/D_2)}$ $[p = 95/(95 + 1.6)]$ adalah 98,3 persen. Dengan menggunakan perhitungan PPV yang lebih rendah tersebut di atas dari 82,3 persen, probabilitas kejadian sebenarnya adalah 98,1 persen.

Lihat sesuatu yang ~~aneh~~ koheren di sini? Saya yakin tidak ...

Ini adalah teorema Bayes sebagaimana Elston dan Johnson ^{₍₁₉₉₄₎} menerapkannya pada contoh hereditas hemofilia:

$P (D_{1} | S) = \frac{P (D_{1}) P (S | D_{1})}{P (D_{1}) P (S | D_{1}) + P (D_{2}) P (S | D_{2})}$ $\rm P(D_1|S)=\frac{P(D_1)P(S|D_1)}{P(D_1)P(S|D_1)+P(D_2)P(S|D_2)}$

Perbedaan itu berbicara sendiri, tetapi inilah kutipan dari diskusi mereka tentang contoh ini:

Fakta bahwa dia memiliki satu putra yang tidak terpengaruh menurunkan kemungkinan dia mewarisi gen hemofilia, dan karenanya kemungkinan bahwa putra keduanya akan terpengaruh.

Di mana Barsness dan rekan mendapat gagasan bahwa prevalensi rendah memperkuat PPV, saya tidak tahu, tetapi mereka jelas tidak memperhatikan buku teks pilihan mereka sendiri.
Mereka tampaknya tidak mengerti bahwa PPV adalah probabilitas dari "acara yang benar" (D ₁ ) diberikan tulang rusuk patah tulang (S). Dengan demikian, dalam demonstrasi puitis lengkap " sampah masuk, buang keluar ", mereka memasukkan PPV mereka sebagai pembilang dan penyebut, menambahkan prevalensi ke penyebut, dan mendapatkan PPV yang lebih tinggi. Sayang sekali mereka tidak menyadari bahwa mereka dapat melanjutkan ad sirkuler ini : Meskipun 98.4 sebenarnya ; yaitu, setiap PPV dapat dikonversi ke 98,4 dengan prevalensi = 1,6 jika versi persamaan mereka benar dengan menerapkannya secara iteratif.
$p_{1} = 95 / (95 + 1.6) = 98.3 \to p_{2} = 98.3 / (98.3 + 1.6) = 98.4 \to \dots$ $p_1 = 95/(95 + 1.6)=98.3\rightarrow p_2 = 98.3/(98.3 + 1.6)=98.4\rightarrow\dots$ $\lim_{k\rightarrow\infty} p_k(p_{k-1},1.6)$
Ketika menggunakan informasi prevalensi mereka dan beberapa perkiraan yang masuk akal dari sensitivitas dan spesifisitas dari penelitian lain pada topik, PPV ternyata jauh lebih rendah (mungkin serendah 3%). Yang lucu adalah bahwa saya bahkan tidak akan berpikir untuk menggunakan teorema Bayes jika mereka tidak mencoba menggunakannya untuk memperkuat kasus mereka. Jelas tidak akan berhasil seperti itu mengingat prevalensi 1,6%.

^{Referensi

· Barsness, KA, Cha, ES, Bensard, DD, Calkins, CM, Partrick, DA, Karrer, FM, & Strain, JD (2003). Nilai prediktif positif patah tulang rusuk sebagai indikator trauma non-kebetulan pada anak-anak. Jurnal Trauma-Injury, Infection, and Critical Care, 54 (6), 1107–1110.

· Elston, RC, & Johnson, WD (1994). Hal-hal penting dari biostatistik (edisi kedua). Philadelphia: Perusahaan FA Davis.

· Ricci, LR (2004). Surat kepada Editor. Jurnal Trauma-Injury, Infection, and Critical Care, 56 (3), 721.}

Nick Stauner
sumber

Contoh-contoh penerapan teorema Bayes yang salah

Jawaban: