Saya mencoba untuk membungkus kepala saya di sekitar hasil Bayes Theorem yang diterapkan pada contoh mammogram klasik, dengan twist mammogram menjadi sempurna.
Itu adalah,
Timbulnya kanker:
Kemungkinan mammogram positif, mengingat pasien menderita kanker:
Probabilitas mammogram positif, mengingat pasien tidak memiliki kanker:
By Bayes:
P (kanker | mammogram +) =
Jadi, jika orang secara acak dari populasi mengambil mammogram, dan mendapatkan hasil positif, ada kemungkinan 50% mereka menderita kanker? Saya gagal memahami secara intuitif bagaimana peluang kecil 1% dari positif palsu di 1% populasi dapat memicu hasil 50%. Secara logis, saya akan berpikir mammogram positif yang benar-benar benar dengan tingkat positif palsu kecil akan jauh lebih akurat.
Jawaban:
Saya akan menjawab pertanyaan ini baik dari sudut pandang medis maupun statistik. Ini telah menerima banyak perhatian di media massa, terutama setelah buku terlaris The Signal dan the Noise oleh Nate Silver, serta sejumlah artikel dalam publikasi seperti The New York Times yang menjelaskan konsep tersebut. Jadi saya sangat senang bahwa @ user2666425 membuka topik ini di CV.
Pertama, izinkan saya menjelaskan bahwa tidak akurat. Saya dapat memberitahu Anda bahwa sosok ini akan menjadi mimpi yang menjadi kenyataan. Sayangnya ada banyakmammogramnegatif palsu, terutama pada wanita dengan jaringan payudara yang padat. Angka perkiraan bisa 20 % atau lebih tinggi, tergantung pada apakah Anda mengelompokkan semua jenis kanker payudara menjadi satu (invasif DCIS), dan faktor lainnya. Ini adalah alasan mengapa modalitas lain berdasarkan teknologi sonografi atau MRI juga diterapkan. Perbedaan antara 0,8 dan 1 sangat penting dalam tes skrining.hal( + | C) = 1 20 % 0.8 1
Teorema Bayes memberi tahu kita bahwa , dan baru-baru ini mendapat banyak perhatian karena berkaitan dengan mamografipada wanita muda yang berisiko rendah. Saya menyadari ini bukan apa yang Anda tanyakan, yang saya bahas dalam paragraf terakhir, tetapi ini adalah topik yang paling diperdebatkan. Berikut ini adalah rasa masalahnya:p ( C|+ ) = p ( + | C)p ( + )∗ p ( C)
The sebelum (atau kemungkinan memiliki kanker berdasarkan prevalensi) di muda pasien, mengatakan 40-50 tahun agak kecil. Menurut NCI itu akan dapat mengumpulkannya di (lihat tabel di bawah). Probabilitas pra-tes yang relatif rendah ini dengan sendirinya mengurangi kemungkinan bersyarat pasca-tes memiliki kanker mengingat bahwa mammogram positif, terlepas dari kemungkinan atau data yang dikumpulkan.∼ 1,5 %
Peluang positif palsu menjadi masalah yang sangat signifikan pada prosedur penyaringan yang akan diterapkan pada ribuan dan ribuan wanita sehat apriori. Jadi, meskipun tingkat positif palsu (yang jauh lebih tinggi jika Anda fokus pada risiko kumulatif ) mungkin tidak terdengar terlalu buruk, itu sebenarnya merupakan masalah biaya psikologis dan ekonomis yang besar, terutama mengingat pra-tes yang rendah probabilitas pada pasien yang lebih muda, risiko rendah. Angka 1 % Anda secara luas melenceng - kenyataannya adalah bahwa "ketakutan" sangat umum karena banyak faktor, termasuk masalah medikolegal.7 - 10 % 1 %
Jadi, menghitung ulang dan sangat penting, untuk wanita muda tanpa faktor risiko :
.= p ( + | C)p ( + | C)∗p ( C)+p ( + | C¯)∗p ( C¯)∗ p ( C) = 0.80,8 ∗ 0,015+0,07 ∗ 0,985∗0,015 = 0,148
Probabilitas menderita kanker ketika skrining mammogram telah dibaca sebagai positif dapat serendah pada wanita muda yang berisiko rendah. Sebagai tambahan, pembacaan mamografi datang dengan perkiraan tidak langsung dari kepercayaan pada diagnosis yang dimiliki oleh ahli radiologi (disebut BI-RADS), dan analisis Bayesian ini akan berubah secara radikal ketika kita berkembang dari BI-RADS 3 ke BI-RADS 5 - semuanya "tes positif" dalam arti luas.15 %
Angka ini secara logis dapat diubah tergantung pada perkiraan apa yang Anda pertimbangkan dalam perhitungan Anda, tetapi kenyataannya adalah bahwa rekomendasi untuk usia awal untuk memasuki program skrining mamografi baru40 45 - baru ini telah ditingkatkan dari usia 40 hingga 45 tahun .
Pada wanita yang lebih tua prevalensi (dan karenanya probabilitas pre-test) meningkat secara linear seiring bertambahnya usia. Menurut laporan saat ini, risiko bahwa seorang wanita akan didiagnosis dengan kanker payudara selama 10 tahun ke depan , dimulai pada usia berikut, adalah sebagai berikut:
Ini menghasilkan risiko kumulatif seumur hidup sekitar :10 %
Perhitungan pada wanita yang lebih tua dengan prevalensi adalah:4 %
Jawaban khusus untuk pertanyaan Anda:
Masalah intuisi: @ Juho Kokkala mengemukakan masalah yang ditanyakan OP tentang intuisi . Saya pikir itu tersirat dalam perhitungan dan paragraf penutup, tetapi cukup adil ... Ini adalah bagaimana saya akan menjelaskannya kepada seorang teman ... Mari kita berpura-pura kita akan mencari pecahan meteor dengan detektor logam di Winslow, Arizona. Disini:
Gambar dari meteorcrater.com
... dan detektor logam berbunyi. Nah, jika Anda mengatakan bahwa kemungkinan itu berasal dari koin yang dijatuhkan turis, Anda mungkin benar. Tapi Anda mendapatkan intinya: jika tempat itu tidak begitu diperiksa, akan lebih mungkin bahwa bunyi bip dari detektor di tempat seperti ini berasal dari pecahan meteor daripada jika kami berada di jalan-jalan NYC.
Apa yang kita lakukan dengan mamografi adalah pergi ke populasi yang sehat, mencari penyakit diam yang jika tidak diketahui lebih awal bisa mematikan. Untungnya, prevalensi (walaupun sangat tinggi dibandingkan dengan kanker lain yang tidak dapat disembuhkan) cukup rendah sehingga kemungkinan kanker secara acak ditemukan rendah, bahkan jika hasilnya "positif" , dan terutama pada wanita muda.
Karena kita tidak pernah memiliki alat atau sistem pengukuran yang sangat akurat, fraksikemungkinanp (+) tanpa syarat= p ( + | C)p ( + | C)∗p ( C)+p ( + | C¯)∗p ( C¯) < 1 p ( C) posterior = α ∗ sebelumnya posterior < sebelumnya positive predictive value (PPV) : probabilitas bahwa subjek dengan tes skrining positif benar-benar memiliki penyakit.
sumber
Masalah utama dengan mamografi yang belum ditangani secara memadai dalam wacana adalah definisi "positif" yang salah. Ini dijelaskan dalam bab Diagnosis di http://biostat.mc.vanderbilt.edu/ClinStat - lihat tautan untuk Biostatistik dalam Penelitian Biomedis di sana.
Salah satu sistem pengkodean diagnostik yang paling banyak digunakan dalam mamografi adalah skor BI-RADS, dan skor 4 adalah hasil "positif" yang sering. Definisi kategori 4 adalah "Bukan karakteristik kanker payudara, tetapi kemungkinan masuk akal untuk menjadi ganas (3 hingga 94%); biopsi harus dipertimbangkan." Dengan rentang risiko yang jauh dari 0,03 hingga 0,94 untuk satu kategori , yaitu heterogenitas yang luar biasa dalam arti "positif", tidak mengherankan bahwa kita memiliki kekacauan di tangan kita.
Ini juga merupakan tanda pemikiran yang tidak jelas bahwa sistem BI-RADS tidak memiliki kategori untuk seseorang dengan perkiraan risiko 0,945.
Seperti yang dikatakan Nate Silver dengan fasih dalam The Signal and the Noise , jika kita berpikir secara probabilistik kita akan membuat keputusan yang lebih baik di sekitar kita. Menghapus istilah seperti "positif" dan "negatif" untuk tes medis akan menghilangkan positif palsu dan negatif palsu dan menyampaikan ketidakpastian (dan pembenaran untuk lebih banyak tes sebelum membuat diagnosis) secara optimal.
sumber
Ada diskusi yang bagus tentang ini dalam buku Risiko Terhitung
Sebagian besar buku ini adalah tentang menemukan cara-cara yang lebih jelas untuk dibicarakan, dan memikirkan, probabilitas dan risiko. Sebuah contoh:
Peluang seorang wanita berusia 40 tahun menderita kanker payudara adalah sekitar 1 persen. Jika dia menderita kanker payudara, kemungkinan dia akan dites positif pada skrining mammogram adalah sekitar 90 persen. Jika dia tidak menderita kanker payudara, kemungkinan bahwa dia akan tetap positif adalah 9 persen. Bagaimana kemungkinan seorang wanita yang dites positif menderita kanker payudara?
Ini adalah cara buku ini menyajikan solusinya, menggunakan 'frekuensi alami'. Pertimbangkan 10.000 wanita, 1% menderita kanker sehingga 100 wanita. Dari jumlah tersebut, 90% akan mengembalikan tes positif (yaitu 90 wanita dengan kanker akan tes positif). Dari 9900 tanpa kanker, 9% akan mengembalikan tes positif atau 891 wanita. Jadi ada 891 + 90 = 981 wanita dengan tes positif yang 90 memiliki kanker. Jadi kemungkinan seorang wanita dengan hasil tes positif menderita kanker adalah 90/981 = 0,092
Jika 100% wanita dengan tes kanker positif itu hanya mengubah angka sedikit menjadi 100 / (100 + 891) = 0,1
sumber
Mungkin garis pemikiran ini benar ?:
sumber
Berikut ini cara yang disederhanakan namun intuitif untuk melihatnya. Pertimbangkan 100 orang. Seseorang menderita kanker dan akan dites positif. Dari 99 yang tidak, salah satunya akan mendapatkan tes positif palsu. Jadi, dari dua hal positif, satu akan menderita kanker dan satu tidak.
sumber