Interpretasi Bayes Theorem diterapkan untuk hasil mamografi positif

11

Saya mencoba untuk membungkus kepala saya di sekitar hasil Bayes Theorem yang diterapkan pada contoh mammogram klasik, dengan twist mammogram menjadi sempurna.

Itu adalah,

Timbulnya kanker:.01

Kemungkinan mammogram positif, mengingat pasien menderita kanker:1

Probabilitas mammogram positif, mengingat pasien tidak memiliki kanker:.01

By Bayes:

P (kanker | mammogram +) =1.01(1.01)+(0,091.99)

=.5025

Jadi, jika orang secara acak dari populasi mengambil mammogram, dan mendapatkan hasil positif, ada kemungkinan 50% mereka menderita kanker? Saya gagal memahami secara intuitif bagaimana peluang kecil 1% dari positif palsu di 1% populasi dapat memicu hasil 50%. Secara logis, saya akan berpikir mammogram positif yang benar-benar benar dengan tingkat positif palsu kecil akan jauh lebih akurat.

pengguna2666425
sumber
2
Tingkat positif palsu tidak pada 1% melainkan 99% dari populasi. Itu sebabnya Anda mendapatkan probabilitas yang mungkin tampak rendah, karena probabilitas sebelumnya yang sangat tinggi bahwa seseorang itu sehat. Ingat juga bahwa ini hanya tes tunggal, apa yang terjadi jika Anda mengikuti tes lebih dari satu kali? Kemudian keakuratan tes mulai lebih berarti.
dsaxton
Jika ini adalah mammogram sempurna, maka tingkat positif palsu akan menjadi nol, dan kemudian p (C | M) = 1 * 0,01 / (1 * 0,01 + 0 * 0,99) = 1,0 Karena laju positif palsu dari pendekatan mammogram mendekati kesempurnaan (0) maka suku kedua di bagian bawah mendekati nol. Tingkat positif palsu 'kecil' bergabung dengan tarif dasar kecil yang sama untuk membuat hasil yang berlawanan dengan intuisi.
Dave X
Namun, pengalaman saya menunjukkan bahwa logika, dari jenis deduktif formal, adalah hal yang luar biasa tetapi menghasilkan intuisi yang sangat buruk tentang kesimpulan probabilistik. Alat di sini bmj.com/content/343/bmj.d6386 dapat membantu intuisi Anda.
conjugateprior
Dalam pemahaman saya, pertanyaannya adalah meminta intuisi tentang bagaimana probabilitas kondisional dapat sangat rendah dengan asumsi; bukan tentang statistik mamografi kehidupan nyata yang sebenarnya (yang nampaknya jawabannya).
Juho Kokkala
Saya tihnk ada kesalahan ketik dalam penyebut (istilah ke-2 seharusnya (.01 * 0.99)? Namun hasilnya benar. Tidak benar-benar intuisi tetapi menyederhanakan Anda memiliki P (C | +) = P (C) / (P (C)) + (P (+ |! C) P (! C)) dan P (C) sangat rendah, jadi P (C | +) sangat sensitif terhadap P (+ |! C), artinya Anda memerlukan P ( + |! C) << P (C) untuk mendapatkan P (C | +) untuk mendekati 1
David Waterworth

Jawaban:

11

Saya akan menjawab pertanyaan ini baik dari sudut pandang medis maupun statistik. Ini telah menerima banyak perhatian di media massa, terutama setelah buku terlaris The Signal dan the Noise oleh Nate Silver, serta sejumlah artikel dalam publikasi seperti The New York Times yang menjelaskan konsep tersebut. Jadi saya sangat senang bahwa @ user2666425 membuka topik ini di CV.

Pertama, izinkan saya menjelaskan bahwa tidak akurat. Saya dapat memberitahu Anda bahwa sosok ini akan menjadi mimpi yang menjadi kenyataan. Sayangnya ada banyakmammogramnegatif palsu, terutama pada wanita dengan jaringan payudara yang padat. Angka perkiraan bisa 20 % atau lebih tinggi, tergantung pada apakah Anda mengelompokkan semua jenis kanker payudara menjadi satu (invasif DCIS), dan faktor lainnya. Ini adalah alasan mengapa modalitas lain berdasarkan teknologi sonografi atau MRI juga diterapkan. Perbedaan antara 0,8 dan 1 sangat penting dalam tes skrining.hal(+|C)=120%0.81

Teorema Bayes memberi tahu kita bahwa , dan baru-baru ini mendapat banyak perhatian karena berkaitan dengan mamografipada wanita muda yang berisiko rendah. Saya menyadari ini bukan apa yang Anda tanyakan, yang saya bahas dalam paragraf terakhir, tetapi ini adalah topik yang paling diperdebatkan. Berikut ini adalah rasa masalahnya:hal(C|+)=hal(+|C)hal(+)hal(C)

  1. The sebelum (atau kemungkinan memiliki kanker berdasarkan prevalensi) di muda pasien, mengatakan 40-50 tahun agak kecil. Menurut NCI itu akan dapat mengumpulkannya di (lihat tabel di bawah). Probabilitas pra-tes yang relatif rendah ini dengan sendirinya mengurangi kemungkinan bersyarat pasca-tes memiliki kanker mengingat bahwa mammogram positif, terlepas dari kemungkinan atau data yang dikumpulkan.1.5%

  2. Peluang positif palsu menjadi masalah yang sangat signifikan pada prosedur penyaringan yang akan diterapkan pada ribuan dan ribuan wanita sehat apriori. Jadi, meskipun tingkat positif palsu (yang jauh lebih tinggi jika Anda fokus pada risiko kumulatif ) mungkin tidak terdengar terlalu buruk, itu sebenarnya merupakan masalah biaya psikologis dan ekonomis yang besar, terutama mengingat pra-tes yang rendah probabilitas pada pasien yang lebih muda, risiko rendah. Angka 1 % Anda secara luas melenceng - kenyataannya adalah bahwa "ketakutan" sangat umum karena banyak faktor, termasuk masalah medikolegal.7-10%1%

Jadi, menghitung ulang dan sangat penting, untuk wanita muda tanpa faktor risiko :

hal(C|+)=hal(+|C)hal(+)hal(C)=

.=hal(+|C)hal(+|C)hal(C)+hal(+|C¯)hal(C¯)hal(C)=0.80.80,015+0,070,9850,015=0,148

Probabilitas menderita kanker ketika skrining mammogram telah dibaca sebagai positif dapat serendah pada wanita muda yang berisiko rendah. Sebagai tambahan, pembacaan mamografi datang dengan perkiraan tidak langsung dari kepercayaan pada diagnosis yang dimiliki oleh ahli radiologi (disebut BI-RADS), dan analisis Bayesian ini akan berubah secara radikal ketika kita berkembang dari BI-RADS 3 ke BI-RADS 5 - semuanya "tes positif" dalam arti luas.15%

Angka ini secara logis dapat diubah tergantung pada perkiraan apa yang Anda pertimbangkan dalam perhitungan Anda, tetapi kenyataannya adalah bahwa rekomendasi untuk usia awal untuk memasuki program skrining mamografi baru4045 - baru ini telah ditingkatkan dari usia 40 hingga 45 tahun .

Pada wanita yang lebih tua prevalensi (dan karenanya probabilitas pre-test) meningkat secara linear seiring bertambahnya usia. Menurut laporan saat ini, risiko bahwa seorang wanita akan didiagnosis dengan kanker payudara selama 10 tahun ke depan , dimulai pada usia berikut, adalah sebagai berikut:

Age 30 . . . . . . 0.44 percent (or 1 in 227)
Age 40 . . . . . . 1.47 percent (or 1 in 68)
Age 50 . . . . . . 2.38 percent (or 1 in 42)
Age 60 . . . . . . 3.56 percent (or 1 in 28)
Age 70 . . . . . . 3.82 percent (or 1 in 26)

Ini menghasilkan risiko kumulatif seumur hidup sekitar :10%

Perhitungan pada wanita yang lebih tua dengan prevalensi adalah:4%

hal(C|+)=0.80.80,04+0,070,960,04=0,3232%

hal(C|+)

Jawaban khusus untuk pertanyaan Anda:

hal(+|C¯)7-10%1%hal(C¯)Perhatikan bahwa "tingkat alarm palsu" ini dikalikan dengan proporsi yang jauh lebih besar dari kasus tanpa kanker (dibandingkan dengan pasien dengan kanker) dalam penyebut, bukan "peluang kecil 1% dari positif palsu dalam 1% dari populasi" Anda menyebut. Saya percaya ini adalah jawaban untuk pertanyaan Anda. Untuk menekankan, meskipun ini tidak dapat diterima dalam tes diagnostik, masih bermanfaat dalam prosedur penyaringan.

Masalah intuisi: @ Juho Kokkala mengemukakan masalah yang ditanyakan OP tentang intuisi . Saya pikir itu tersirat dalam perhitungan dan paragraf penutup, tetapi cukup adil ... Ini adalah bagaimana saya akan menjelaskannya kepada seorang teman ... Mari kita berpura-pura kita akan mencari pecahan meteor dengan detektor logam di Winslow, Arizona. Disini:

Gambar dari meteorcrater.com

... dan detektor logam berbunyi. Nah, jika Anda mengatakan bahwa kemungkinan itu berasal dari koin yang dijatuhkan turis, Anda mungkin benar. Tapi Anda mendapatkan intinya: jika tempat itu tidak begitu diperiksa, akan lebih mungkin bahwa bunyi bip dari detektor di tempat seperti ini berasal dari pecahan meteor daripada jika kami berada di jalan-jalan NYC.

Apa yang kita lakukan dengan mamografi adalah pergi ke populasi yang sehat, mencari penyakit diam yang jika tidak diketahui lebih awal bisa mematikan. Untungnya, prevalensi (walaupun sangat tinggi dibandingkan dengan kanker lain yang tidak dapat disembuhkan) cukup rendah sehingga kemungkinan kanker secara acak ditemukan rendah, bahkan jika hasilnya "positif" , dan terutama pada wanita muda.

hal(C¯|+)=0

hal(+|C)hal(+|C)hal(C)+hal(+|C¯)hal(C¯)hal(C)=hal(+|C)hal(+|C)hal(C)hal(C)=1100%

Karena kita tidak pernah memiliki alat atau sistem pengukuran yang sangat akurat, fraksikemungkinanp (+) tanpa syarat=hal(+|C)hal(+|C)hal(C)+hal(+|C¯)hal(C¯)<1hal(C)belakang=αsebelumnyabelakang<sebelumnyapositive predictive value (PPV) : probabilitas bahwa subjek dengan tes skrining positif benar-benar memiliki penyakit.

Antoni Parellada
sumber
5

Masalah utama dengan mamografi yang belum ditangani secara memadai dalam wacana adalah definisi "positif" yang salah. Ini dijelaskan dalam bab Diagnosis di http://biostat.mc.vanderbilt.edu/ClinStat - lihat tautan untuk Biostatistik dalam Penelitian Biomedis di sana.

Salah satu sistem pengkodean diagnostik yang paling banyak digunakan dalam mamografi adalah skor BI-RADS, dan skor 4 adalah hasil "positif" yang sering. Definisi kategori 4 adalah "Bukan karakteristik kanker payudara, tetapi kemungkinan masuk akal untuk menjadi ganas (3 hingga 94%); biopsi harus dipertimbangkan." Dengan rentang risiko yang jauh dari 0,03 hingga 0,94 untuk satu kategori , yaitu heterogenitas yang luar biasa dalam arti "positif", tidak mengherankan bahwa kita memiliki kekacauan di tangan kita.

Ini juga merupakan tanda pemikiran yang tidak jelas bahwa sistem BI-RADS tidak memiliki kategori untuk seseorang dengan perkiraan risiko 0,945.

Seperti yang dikatakan Nate Silver dengan fasih dalam The Signal and the Noise , jika kita berpikir secara probabilistik kita akan membuat keputusan yang lebih baik di sekitar kita. Menghapus istilah seperti "positif" dan "negatif" untuk tes medis akan menghilangkan positif palsu dan negatif palsu dan menyampaikan ketidakpastian (dan pembenaran untuk lebih banyak tes sebelum membuat diagnosis) secara optimal.

Frank Harrell
sumber
Kami menulis dalam sinkronisasi praktis - periksa komentar saya di bawah ini tentang BI-RADS. Saya sangat setuju (banyak pengalaman pribadi tentang ini sebagai ahli radiologi).
Antoni Parellada
3

Ada diskusi yang bagus tentang ini dalam buku Risiko Terhitung

Sebagian besar buku ini adalah tentang menemukan cara-cara yang lebih jelas untuk dibicarakan, dan memikirkan, probabilitas dan risiko. Sebuah contoh:

Peluang seorang wanita berusia 40 tahun menderita kanker payudara adalah sekitar 1 persen. Jika dia menderita kanker payudara, kemungkinan dia akan dites positif pada skrining mammogram adalah sekitar 90 persen. Jika dia tidak menderita kanker payudara, kemungkinan bahwa dia akan tetap positif adalah 9 persen. Bagaimana kemungkinan seorang wanita yang dites positif menderita kanker payudara?

Ini adalah cara buku ini menyajikan solusinya, menggunakan 'frekuensi alami'. Pertimbangkan 10.000 wanita, 1% menderita kanker sehingga 100 wanita. Dari jumlah tersebut, 90% akan mengembalikan tes positif (yaitu 90 wanita dengan kanker akan tes positif). Dari 9900 tanpa kanker, 9% akan mengembalikan tes positif atau 891 wanita. Jadi ada 891 + 90 = 981 wanita dengan tes positif yang 90 memiliki kanker. Jadi kemungkinan seorang wanita dengan hasil tes positif menderita kanker adalah 90/981 = 0,092

Jika 100% wanita dengan tes kanker positif itu hanya mengubah angka sedikit menjadi 100 / (100 + 891) = 0,1

Pendekatan frekuensi alami untuk memahami positif palsu

Tony Ladson
sumber
1

Mungkin garis pemikiran ini benar ?:

.011

0,0025

pengguna2666425
sumber
1

Berikut ini cara yang disederhanakan namun intuitif untuk melihatnya. Pertimbangkan 100 orang. Seseorang menderita kanker dan akan dites positif. Dari 99 yang tidak, salah satunya akan mendapatkan tes positif palsu. Jadi, dari dua hal positif, satu akan menderita kanker dan satu tidak.

Emil Friedman
sumber