Ada seseorang di balik tirai - saya tidak tahu apakah orang itu perempuan atau laki-laki.
Saya tahu orang itu memiliki rambut panjang, dan 90% dari semua orang dengan rambut panjang adalah perempuan
Saya tahu orang tersebut memiliki tipe darah AX3 yang langka, dan bahwa 80% dari semua orang dengan tipe darah ini adalah wanita.
Berapa probabilitas orang itu perempuan?
CATATAN: formulasi asli ini telah diperluas dengan dua asumsi lebih lanjut: 1. Golongan darah dan panjang rambut independen 2. Rasio pria: wanita dalam populasi pada umumnya adalah 50:50
(Skenario spesifik di sini tidak begitu relevan - lebih tepatnya, saya memiliki proyek mendesak yang mengharuskan saya mengarahkan pikiran saya pada pendekatan yang benar untuk menjawab ini. Perasaan saya adalah bahwa ini adalah masalah probabilitas sederhana, dengan jawaban definitif sederhana, alih-alih daripada sesuatu dengan beberapa jawaban yang bisa diperdebatkan menurut teori statistik yang berbeda.
sumber
Jawaban:
Banyak orang merasa terbantu untuk berpikir mengenai "populasi", subkelompok di dalamnya, dan proporsi (daripada probabilitas). Ini cocok dengan alasan visual.
Saya akan menjelaskan angka-angka secara rinci, tetapi tujuannya adalah bahwa perbandingan cepat dari kedua angka tersebut harus segera dan meyakinkan menunjukkan bagaimana dan mengapa tidak ada jawaban spesifik untuk pertanyaan yang dapat diberikan. Pemeriksaan yang sedikit lebih lama akan menyarankan informasi tambahan apa yang akan berguna untuk menentukan jawaban atau setidaknya mendapatkan batasan pada jawaban.
Legenda
Penetasan silang : betina / Latar belakang padat : jantan.
Atas : berambut panjang / Bawah : berambut pendek.
Kanan (dan berwarna) : AX3 / Kiri (tidak berwarna ) : non-AX3.
Data
Penetasan silang atas adalah 90% dari persegi panjang atas ("90% dari semua orang dengan rambut panjang adalah perempuan").
Penetasan silang total dalam persegi panjang berwarna kanan adalah 80% dari persegi panjang itu ("80% dari semua orang dengan golongan darah ini adalah wanita.")
Penjelasan
Diagram ini menunjukkan secara skematis bagaimana populasi (dari semua wanita dan non-wanita yang dipertimbangkan) dapat secara bersamaan dipartisi menjadi wanita / non-wanita, AX3 / non-AX3, dan berambut panjang / tidak berambut panjang ("pendek"). Menggunakan area, setidaknya kira-kira, untuk mewakili proporsi (ada beberapa berlebihan untuk membuat gambar lebih jelas).
Jelaslah bahwa ketiga klasifikasi biner ini menciptakan delapan kelompok yang mungkin. Setiap grup muncul di sini.
Informasi yang diberikan menyatakan bahwa rectangle cross-hatched rectangle (wanita berambut panjang) terdiri dari 90% dari rectangle top (semua orang berambut panjang). Ini juga menyatakan bahwa bagian gabungan lintas-menetas dari persegi panjang berwarna (perempuan berambut panjang dengan AX3 dan perempuan berambut pendek dengan AX3) terdiri dari 80% wilayah berwarna di sebelah kanan (semua orang dengan AX3). Kami diberitahu bahwa seseorang terletak di sudut kanan atas (panah): orang berambut panjang dengan AX3. Berapa proporsi persegi panjang ini yang menetas silang (betina)?
Saya juga (secara implisit) berasumsi bahwa golongan darah dan panjang rambut tidak tergantung : proporsi dari persegi panjang atas (rambut panjang) yang diwarnai (AX3) sama dengan proporsi persegi panjang bawah (rambut pendek) yang diwarnai (AX3). Itulah arti kemerdekaan. Ini adalah asumsi yang wajar dan alami ketika menjawab pertanyaan seperti ini, tetapi tentu saja perlu dinyatakan.
Posisi persegi panjang lintas silang (betina berambut panjang) tidak diketahui. Kita dapat membayangkan menggeser sisi persegi panjang berujung silang dari sisi ke sisi dan menggeser sisi bawah persegi panjang sisi-ke-sisi dan mungkin mengubah lebarnya. Jika kita melakukan ini sehingga 80% dari persegi panjang berwarna tetap menetas silang, perubahan semacam itu tidak akan mengubah informasi yang disebutkan, namun itu dapat mengubah proporsi wanita di persegi panjang kanan atas. Jelas proporsinya bisa di mana saja antara 0% dan 100% dan masih konsisten dengan informasi yang diberikan, seperti pada gambar ini:
Salah satu kekuatan metode ini adalah ia menetapkan keberadaan beberapa jawaban untuk pertanyaan itu. Seseorang dapat menerjemahkan semua ini secara aljabar dan, dengan cara menetapkan probabilitas, menawarkan situasi tertentu sebagai contoh yang mungkin, tetapi kemudian pertanyaan akan muncul apakah contoh seperti itu benar-benar konsisten dengan data. Misalnya, jika seseorang menyarankan bahwa mungkin 50% dari orang berambut panjang adalah AX3, pada awalnya tidak jelas bahwa ini bahkan mungkin dilakukan mengingat semua informasi yang tersedia. Diagram (Venn) populasi dan subkelompoknya memperjelas hal tersebut.
sumber
Ini adalah pertanyaan tentang probabilitas kondisional. Anda tahu bahwa orang tersebut memiliki rambut panjang dan tipe darah Ax3. Biarkan A = { 'Orang itu berambut panjang' } Jadi Anda mencari P ( C | A dan B ) . Anda tahu bahwa P ( C | A ) = 0,9 dan P ( C | B ) = 0,8 . Apakah itu cukup untuk menghitung P ( C | A dan B ) ? Misalkan P ( A dan B dan C ) = 0,7
Sekarang keduanya dimungkinkan ketika dan P ( C | B ) = 0,8 . Jadi kita tidak bisa memastikan apa itu P ( C | A dan B ) .P(C|A)=0.9 P(C|B)=0.8 P(C|A and B)
sumber
Diskusi yang menarik! Saya bertanya-tanya apakah kita menentukan P (A) dan P (B) juga apakah rentang P (C | A, B) tidak akan jauh lebih sempit daripada interval penuh [0,1], hanya karena banyaknya kendala kita punya.
Menempel notasi yang diperkenalkan di atas:
A = peristiwa orang tersebut berambut panjang
B = peristiwa orang tersebut memiliki golongan darah AX3
C = acara orang itu adalah wanita
P (C | A) = 0,9
P (C | B) = 0,8
P (C) = 0,5 (yaitu mari kita asumsikan rasio yang sama antara pria dan wanita dalam populasi pada umumnya)
tampaknya tidak mungkin untuk mengasumsikan bahwa peristiwa A dan B bersifat kondisional independen mengingat C! Itu mengarah langsung ke kontradiksi: jikaP(A∧B|C)=P(A|C)⋅P(B|C)=P(C|A)P(A)P(C)⋅P(C|B)P(B)P(C)
kemudian
Jika kita sekarang berasumsi bahwa A dan B juga independen: sebagian besar syarat dibatalkan dan kami berakhir denganP(A∧B)=P(A)P(B)
Menindaklanjuti representasi geometris yang luar biasa dari masalah: Walaupun memang benar bahwa secara umum dapat mengasumsikan nilai apa pun dalam interval [ 0 , 1 ] kendala geometrik melakukan mempersempit kisaran nilai yang mungkin secara signifikan untuk nilai-nilai P ( A ) dan P ( B ) yang tidak "terlalu kecil". (Meskipun kita juga bisa membatasi marginal: P ( A ) dan P ( B ) )P(C|A∧B) [0,1] P(A) P(B) P(A) P(B)
Mari kita hitung {\ bf nilai sekecil mungkin} untuk bawah batasan geometris berikut:P(C|A∧B)
1. Fraksi area atas (A TRUE) yang dicakup oleh persegi panjang atas harus sama denganP(C|A)=0.9
2. Jumlah area dari dua persegi panjang harus sama denganP(C)=0.5
3. Jumlah fraksi dari area dari dua persegi panjang berwarna (yaitu tumpang tindih dengan event B) harus sama denganP(C|B)=0.8
4. (sepele) Persegi panjang atas tidak dapat dipindahkan melampaui batas kiri dan tidak boleh dipindahkan melampaui batas minimum tumpang tindih ke kiri.
5. (sepele) Kotak lebih rendah tidak dapat dipindahkan melampaui batas kanan dan tidak boleh dipindahkan melebihi batas maksimumnya ke kanan.
Berjalan melalui rentang nilai yang mungkin untuk skrip P (A) dan P (B) ( R ) menghasilkan grafik ini
Sebagai kesimpulan, kita dapat menurunkan probabilitas kondisional P (c | A, B) untuk diberikan P (A), P (B)
sumber
Buat hipotesisnya adalah bahwa orang di balik tirai adalah wanita.
Kami daerah diberi 2 buah bukti, yaitu:
Bukti 1: Kami tahu orang tersebut memiliki rambut panjang (dan kami diberitahu bahwa 90% dari semua orang dengan rambut panjang adalah perempuan)
Bukti 2: Kami tahu orang tersebut memiliki tipe darah langka AX3 (dan kami diberitahu bahwa 80% dari semua orang dengan tipe darah ini adalah wanita)
Diberikan hanya Bukti 1, kita dapat menyatakan bahwa orang di balik tirai memiliki nilai probabilitas 0,9 untuk menjadi seorang wanita (dengan asumsi 50:50 memisahkan antara pria dan wanita).
Mengenai pertanyaan yang diajukan sebelumnya di utas, yaitu "Apakah Anda setuju bahwa jawabannya harus LEBIH DARI 0,9?", Tanpa melakukan Matematika, saya akan mengatakan secara intuitif, jawabannya harus "ya" (itu LEBIH BESAR dari 0,9). Logikanya adalah bahwa Bukti 2 adalah bukti pendukung (sekali lagi, dengan asumsi 50:50 untuk jumlah pria dan wanita di dunia). Jika kami diberitahu bahwa 50% dari semua orang dengan darah tipe AX3 adalah wanita, maka Bukti 2 akan menjadi netral dan tidak memiliki kaitan. Tetapi karena kita diberitahu bahwa 80% dari semua orang dengan golongan darah ini adalah perempuan, Bukti 2 adalah bukti pendukung dan secara logis harus mendorong probabilitas akhir seorang wanita di atas 0,9.
Untuk menghitung probabilitas tertentu, kita dapat menerapkan aturan Bayes untuk Bukti 1 dan kemudian menggunakan pembaruan Bayesian untuk menerapkan Bukti 2 pada hipotesis baru.
Seharusnya:
A = peristiwa orang tersebut berambut panjang
B = peristiwa orang tersebut memiliki golongan darah AX3
C = peristiwa orang itu perempuan (anggap 50%)
Menerapkan aturan Bayes ke Bukti 1:
P (C | A) = (P (A | C) * P (C)) / P (A)
Dalam hal ini, sekali lagi jika kita mengasumsikan pembagian 50:50 antara pria dan wanita:
P (A) = (0,5 * 0,9) + (0,5 * 0,1) = 0,5
Jadi, P (C | A) = (0,9 * 0,5) / 0,5 = 0,9 (Tidak mengherankan, tetapi akan berbeda jika kita tidak memiliki 50:50 antara pria dan wanita)
Menggunakan pembaruan Bayesian untuk menerapkan Bukti 2 dan menghubungkan 0,9 sebagai probabilitas sebelumnya yang baru, kami memiliki:
P (C | A AND B) = (P (B | C) * 0.9) / P (E)
Di sini, P (E) adalah probabilitas Bukti 2, mengingat hipotesis bahwa orang tersebut sudah memiliki peluang 90% untuk menjadi perempuan.
P (E) = (0,9 * 0,8) + (0,1 * 0,2) [ini adalah hukum probabilitas total: (P (wanita) * P (AX3 | wanita) + P (pria) * P (AX3 | pria)] Jadi , P (E) = 0,74
Jadi, P (C | A AND B) = (0,8 * 0,9) / 0,74 = 0,97297
sumber
Penyajian Kembali Pertanyaan dan Generalisasi
Jawaban
Kasus 1
Telah ditunjukkan oleh berbagai cara esoteris bahwa distribusi untuk menetapkan ketika informasi tidak menentukan solusi adalah salah satu yang, dari semua distribusi yang konsisten dengan informasi yang diketahui, memiliki entropi terbesar. Distribusi lain menyiratkan bahwa kita mengetahui lebih dari informasi yang diketahui, yang tentu saja merupakan kontradiksi.
Kasus 2
Kasus 3
Kasus 4
sumber
Saya percaya sekarang bahwa, jika kita mengasumsikan rasio pria dan wanita dalam populasi pada umumnya, maka ada satu jawaban yang tidak terbantahkan.
A = peristiwa orang tersebut berambut panjang
B = peristiwa orang tersebut memiliki golongan darah AX3
C = acara orang itu adalah wanita
P (C | A) = 0,9
P (C | B) = 0,8
P (C) = 0,5 (yaitu mari kita asumsikan rasio yang sama antara pria dan wanita dalam populasi pada umumnya)
Kemudian P (C | A dan B) = [P (C | A) x P (C | B) / P (C)] / [[P (C | A) x P (C | B) / P (C )] + [[1-P (C | A)] x [1-P (C | B)] / [1-P (C)]]]
dalam hal ini, P (C | A dan B) = 0,972973
sumber
Catatan: Untuk mendapatkan jawaban yang pasti, jawaban di bawah ini mengasumsikan bahwa probabilitas seseorang, pria berambut panjang, dan wanita berambut panjang yang memiliki AX3 kira-kira sama. Jika lebih banyak keakuratan diinginkan, ini harus diverifikasi.
Anda mulai dengan pengetahuan bahwa orang tersebut memiliki rambut panjang, jadi pada titik ini kemungkinannya adalah:
Catatan:
Rasio pria dan wanita dalam populasi umum tidak masalah bagi kami setelah kami mengetahui bahwa orang tersebut memiliki rambut panjang. Misalnya, jika ada 1 wanita dalam seratus populasi umum, orang berambut panjang yang dipilih secara acak masih akan menjadi wanita 90% dari waktu.Rasio wanita terhadap pria TIDAK penting! (lihat pembaruan di bawah untuk detailnya)Selanjutnya, kita mengetahui bahwa orang tersebut memiliki AX3. Karena AX3 tidak terkait dengan rambut panjang, rasio pria dan wanita diketahui 50:50, dan karena asumsi kami tentang probabilitas yang sama, kami hanya dapat melipatgandakan setiap sisi dari probabilitas dan menormalkan sehingga jumlah dari sisi-sisi probabilitas sama dengan 100:
Dengan demikian, kemungkinan orang di balik tirai adalah perempuan adalah sekitar 97,297%.
MEMPERBARUI
Berikut ini eksplorasi lebih lanjut dari masalahnya:
Definisi:
Pertama, kita diberi tahu bahwa 90% orang berambut panjang adalah wanita, dan 80% orang dengan AX3 adalah wanita, jadi:
Karena kami berasumsi bahwa probabilitas AX3 tidak tergantung pada jenis kelamin dan rambut panjang, pfx kami yang dihitung akan berlaku untuk wanita dengan rambut panjang, dan pmx akan berlaku untuk pria dengan rambut panjang untuk menemukan jumlah mereka yang mungkin memiliki AX3:
Dengan demikian, rasio kemungkinan jumlah perempuan dengan rambut panjang dan AX3 dengan jumlah laki-laki dengan rambut panjang dan AX3 adalah:
Karena diberi jumlah yang sama yaitu 50:50, Anda dapat membatalkan kedua sisi dan mengakhiri dengan 36 wanita untuk setiap pria. Jika tidak, ada 36 * m / f wanita untuk setiap pria di subkelompok yang ditentukan. Misalnya, jika ada dua kali lebih banyak perempuan daripada laki-laki, akan ada 72 perempuan untuk setiap laki-laki dari mereka yang berambut panjang dan AX3.
sumber
98% Wanita, interpolasi sederhana. Premis pertama 90% betina, daun 10%, premis kedua hanya menyisakan 2% dari 10% yang ada, karenanya 98% betina
sumber