Pertimbangkan pernyataan berikut tentang Titanic:
Asumsi 1: Hanya pria dan wanita yang ada di kapal
Asumsi 2: Ada banyak pria dan wanita
Pernyataan 1: 90 persen dari semua wanita selamat
Pernyataan 2: 90 persen dari semua yang selamat, adalah perempuan
Yang pertama menunjukkan bahwa menyelamatkan perempuan mungkin dari prioritas tinggi (terlepas dari apakah laki-laki yang menyelamatkan itu) atau tidak.
Kapan statistik kedua berguna?
Bisakah kita mengatakan bahwa salah satu dari mereka hampir selalu lebih bermanfaat daripada yang lain?
Jawaban:
Ketika mereka berdiri, tak satu pun dari Pernyataan 1 atau 2 yang sangat berguna. Jika 90% penumpang adalah wanita dan 90% orang selamat secara acak, maka kedua pernyataan itu benar. Pernyataan tersebut perlu dipertimbangkan dalam konteks komposisi penumpang secara keseluruhan. Dan peluang keseluruhan untuk bertahan hidup.
Misalkan kita memiliki pria sebanyak wanita, masing-masing 100. Berikut adalah beberapa kemungkinan matriks pria (M) terhadap wanita (W) dan bertahan (S) terhadap mati (D):
90% wanita selamat. Seperti halnya 90% pria. Pernyataan 1 benar, pernyataan 2 salah, karena setengah dari yang selamat adalah perempuan. Ini konsisten dengan banyak penyintas, tetapi tidak ada perbedaan antara gender .
90% wanita selamat, tetapi hanya 10% pria. 90% dari yang selamat adalah wanita. Kedua pernyataan itu benar. Ini konsisten dengan perbedaan antara jenis kelamin : perempuan lebih mungkin bertahan daripada laki-laki.
9% wanita selamat, tetapi hanya 1% pria. 90% dari yang selamat adalah wanita. Pernyataan 1 salah, Pernyataan 2 benar. Lagi-lagi ini konsisten dengan perbedaan antara jenis kelamin : perempuan lebih mungkin bertahan daripada laki-laki.
sumber
(or indeed, if *everyone* survived)...
Jika semua orang selamat maka 100% dari semua wanita selamat, terlepas dari proporsinya.Di wajahnya, probabilitas bersyarat untuk bertahan hidup bersyarat pada seks lebih bermanfaat, hanya karena arah arus informasi. Jenis kelamin seseorang diketahui sebelum status kelangsungan hidupnya, dan probabilitas ini dapat digunakan dalam arti prediktif, secara prospektif. Juga, itu tidak dipengaruhi oleh prevalensi wanita. Saat ragu, pikirkan prediksi.
sumber
Kata "priority" berasal dari bahasa Latin untuk "before". Prioritas adalah sesuatu yang datang sebelum sesuatu yang lain (di mana "sebelum" digunakan dalam arti "lebih penting"). Jika Anda mengatakan bahwa menyelamatkan perempuan adalah prioritas, maka menyelamatkan perempuan harus didahulukan dari sesuatu yang lain. Dan asumsi alami adalah bahwa apa yang terjadi sebelumnya adalah menyelamatkan manusia. Jika Anda mengatakan "terlepas dari apakah menyelamatkan manusia itu", maka kami bertanya-tanya apa yang terjadi sebelumnya.
Bahwa wanita memiliki tingkat kelangsungan hidup yang tinggi tidak banyak bicara, jika kita tidak tahu apa tingkat kelangsungan hidup secara umum. Kapal terakhir yang saya tumpangi, lebih dari 90% wanita selamat, tetapi saya tidak menganggapnya sebagai menunjukkan bahwa menyelamatkan wanita adalah prioritas tinggi.
Dan mengetahui persentase orang yang selamat adalah wanita tidak banyak bicara tanpa mengetahui persentase orang secara keseluruhan adalah wanita.
Statistik apa yang lebih bermanfaat sangat tergantung pada situasinya. Jika Anda ingin tahu betapa berbahayanya sesuatu, tingkat kematian lebih penting. Jika Anda ingin tahu apa yang memengaruhi seberapa berbahayanya sesuatu, maka perincian persentase korban adalah penting.
sumber
Mungkin bermanfaat bagi kita untuk memeriksa bagaimana probabilitas ini terkait.
Bayes Theorem menggambarkan bagaimana pernyataan probabilitas ini saling terkait.
sumber
Itu tergantung pada apa yang dianggap berguna.
Di sisi lain, jika Anda bertanya-tanya mengapa cerita yang selamat kebanyakan dari wanita, maka pernyataan 2 akan menjelaskan itu, membuat pernyataan 2 berguna bahkan tanpa adanya informasi lain.
Saya tidak dapat memikirkan pernyataan apa pun yang berguna untuk di luar konteks. Jelas tidak mengatakan apa-apa tentang prioritas yang diberikan untuk menyelamatkan wanita, dibandingkan dengan apa pun. Satu-satunya pernyataan yang saya lakukan untuk saya adalah membuat saya mengatakan "ceritakan lebih banyak".
sumber
Di permukaan (atau terpisah dari kenyataan) kedua pernyataan itu tampaknya sama-sama tidak berguna untuk tujuan negara. Namun, mengingat konteksnya, pernyataan kedua jelas lebih bermanfaat.
Pernyataan 2
Mari kita lihat apa yang bisa kita ekstrak dari pernyataan kedua. Rasio wanitaw di antara semua yang selamat adalah:
Kami sedang menguji hypoH0: x > z
Mari kita menulis ulang persamaan untuk mendapatkan kondisi yang diperlukanH0 :
So, for your hypo that women were more likely to survive, all you need is to check that there were less than 90% women among the passengers. This is consistent with your assumption 2, which seems to imply thatp≈1/2 . Hence, I declare that statement 2 all but asserts that women were more likely to survive, i.e. it's quite useful for your goal.
Statement 1
The first statement is truly useless in isolation, but has a limited use in the context. If we pretend we know nothing about the event, then saying thatx=0.9 tells us nothing about z , and whether x>z ?
However, from that little that I know about the event - I haven't seen the movie - it seems unlikely thatx≤z . Why?
We know from Assumption 2 thatp≈1/2 , so the total survival rate is
px+(1−p)z . If we assume that x≈z and p≈1/2 we get
Conclusion
I'd say that both statements support your hypo that women were more likely to survive than men, but Statement 1 does so rather weakly, while Statement 2 in combination with assumptions almost surely establishes your hypo as a fact.
sumber