- Pernyataan Satu (S1): "Satu dari 80 kematian disebabkan oleh kecelakaan mobil."
- Pernyataan Dua (S2): "Satu dari 80 orang meninggal akibat kecelakaan mobil."
Sekarang, saya pribadi tidak melihat banyak perbedaan sama sekali antara kedua pernyataan ini. Saat menulis, saya akan menganggapnya dapat dipertukarkan dengan audiens awam. Namun, saya ditantang oleh dua orang sekarang, dan saya mencari beberapa perspektif tambahan.
Interpretasi default saya untuk S2 adalah, "Dari 80 orang yang diambil secara acak secara acak dari populasi manusia, kita akan mengharapkan salah satu dari mereka mati akibat kecelakaan mobil" - dan saya menganggap pernyataan yang memenuhi syarat ini setara dengan S1.
Pertanyaan saya adalah sebagai berikut:
T1) Apakah interpretasi default saya memang setara dengan Pernyataan Satu?
T2) Apakah tidak biasa atau gegabah untuk ini menjadi interpretasi default saya?
T3) Jika Anda berpikir S1 dan S2 berbeda, sehingga menyatakan yang kedua ketika yang pertama berarti yang menyesatkan / salah, dapatkah Anda memberikan revisi S2 yang sepenuhnya memenuhi syarat yang setara?
Mari kita kesampingkan pertengkaran yang jelas bahwa S1 tidak secara khusus merujuk pada kematian manusia dan menganggap bahwa itu dipahami dalam konteks. Mari kita juga mengesampingkan segala diskusi tentang kebenaran klaim itu sendiri: itu dimaksudkan sebagai ilustrasi.
Sejauh yang bisa saya katakan, ketidaksepakatan yang saya dengar sejauh ini tampaknya berpusat pada default untuk interpretasi yang berbeda dari pernyataan pertama dan kedua.
Untuk yang pertama, penantang saya tampaknya menafsirkannya sebagai 1/80 * num_deaths = jumlah kematian yang disebabkan oleh kecelakaan mobil, tetapi untuk beberapa alasan, default ke interpretasi yang berbeda dari yang kedua di sepanjang baris, "jika Anda memiliki set dari 80 orang, salah satunya akan meninggal dalam kecelakaan mobil "(yang jelas bukan klaim yang setara). Saya akan berpikir bahwa mengingat interpretasi mereka terhadap S1, default untuk S2 adalah membacanya (1/80 * num_dead_people = jumlah orang yang meninggal dalam kecelakaan mobil == jumlah kematian yang disebabkan oleh kecelakaan mobil). Saya tidak yakin mengapa perbedaan dalam interpretasi (standar mereka untuk S2 adalah asumsi yang jauh lebih kuat), atau jika mereka memiliki pengertian statistik bawaan yang sebenarnya kurang.
sumber
Jawaban:
Pertama-tama, pemikiran intuitif pertama saya adalah: "S2 hanya bisa sama dengan S1 jika tingkat kematian lalu lintas tetap konstan, mungkin selama beberapa dekade" - yang tentunya tidak akan menjadi asumsi yang baik dalam beberapa dekade terakhir. Ini sudah mengisyaratkan bahwa satu kesulitan terletak pada asumsi temporal implisit / tak terucapkan.
Saya akan mengatakan pernyataan Anda memiliki formulir
1 di pengalaman .x p o p u l a t i o n e v e n t
Dalam S1, populasinya adalah kematian, dan spesifikasi temporal tersirat saat ini atau "dalam jumlah besar [untuk memiliki jumlah kasus yang mencukupi] tetapi kerangka waktu yang tidak terlalu luas [untuk memiliki karakteristik kecelakaan mobil yang konstan] di sekitar saat ini"
Pada S2, populasinya adalah manusia. Dan yang lain tampaknya membaca ini bukan sebagai "orang yang sekarat" tetapi sebagai "orang yang hidup" (yang setelah semua, adalah apa yang orang lebih sering / lebih lama lakukan). Jika Anda membaca populasi sebagai orang yang hidup, jelas, tidak satu pun dari setiap 80 orang yang hidup sekarang meninggal "sekarang" karena kecelakaan mobil. Jadi itu dibaca sebagai "ketika mereka sekarat [mungkin dekade dari sekarang], penyebab kematian adalah kecelakaan mobil".
Pesan dibawa pulang: selalu berhati-hati untuk menjabarkan siapa populasi Anda dan penyebut fraksi pada umumnya. (Gerd Gigerenzer memiliki makalah tentang tidak mengeja penyebut menjadi penyebab utama kebingungan, terutama dalam statistik dan komunikasi risiko).
sumber
Bagi saya "1 dari 80 kematian ..." sejauh ini merupakan pernyataan yang lebih jelas. Penyebut dalam "1 in 80" Anda adalah himpunan semua peristiwa kematian dan pernyataan itu membuatnya eksplisit.
Ada ambiguitas dalam formulasi "1 dalam 80 orang ...". Anda benar-benar berarti "1 dari 80 orang yang meninggal ..." tetapi pernyataan itu dapat dengan mudah diartikan sebagai "1 dari 80 orang yang sekarang hidup ..." atau serupa.
Saya semua untuk menjadi eksplisit tentang set referensi dalam probabilitas atau pernyataan frekuensi seperti ini. Jika Anda berbicara tentang proporsi kematian, maka katakan "kematian" bukan "orang".
sumber
the 1/80 ratio does focus on the present time in particular
. Atau apakah saya salah paham?Itu tergantung pada apakah Anda menggambarkan atau memprediksi .
"1 dari 80 orang akan meninggal dalam kecelakaan mobil" adalah sebuah prediksi. Dari semua orang yang hidup hari ini, beberapa waktu dalam sisa hidup mereka, satu dari 80 akan mati seperti itu.
"1 dari 80 kematian disebabkan oleh kecelakaan mobil" adalah deskripsi. Dari semua orang yang meninggal dalam periode tertentu (misalnya rentang waktu studi pendukung), 1 dari 80 di antara mereka memang meninggal dalam kecelakaan mobil.
Perhatikan bahwa jendela waktu di sini tidak jelas. Satu kalimat menyiratkan bahwa kematian telah terjadi; yang lain menyiratkan bahwa mereka akan terjadi suatu hari. Satu kalimat menyiratkan bahwa populasi dasar Anda adalah orang-orang yang telah mati (dan yang hidup sebelum itu); yang lain menyiratkan populasi dasar dari orang yang hidup hari ini (dan akan mati pada akhirnya).
Ini sebenarnya pernyataan yang sepenuhnya berbeda, dan hanya satu di antaranya yang mungkin didukung oleh data sumber Anda.
Di samping catatan, ambiguitas muncul dari ketidakcocokan antara keadaan menjadi seseorang (yang terjadi terus menerus) dan peristiwa kematian (yang terjadi pada suatu titik waktu). Setiap kali Anda menggabungkan hal-hal dengan cara ini Anda mendapatkan sesuatu yang sama-sama ambigu. Anda dapat secara instan menyelesaikan ambiguitas dengan menggunakan dua peristiwa, bukan satu keadaan dan satu peristiwa; misalnya, "Dari setiap 80 orang yang lahir, 1 meninggal dalam kecelakaan mobil."
sumber
Kedua pernyataan berbeda karena bias pengambilan sampel, karena kecelakaan mobil lebih mungkin terjadi ketika orang muda.
Mari kita buat ini lebih konkret dengan mengemukakan skenario yang tidak realistis.
Pertimbangkan dua pernyataan:
Kami akan menunjukkan bahwa kedua pernyataan ini tidak sama.
Mari kita menyederhanakan banyak hal dan mengira bahwa setiap orang yang lahir akan meninggal karena serangan jantung pada usia 80 atau kecelakaan mobil pada usia 40 tahun. Selanjutnya, anggaplah pernyataan pertama di atas berlaku, dan bahwa kita berada dalam populasi dalam keadaan stabil, jadi kematian menyeimbangkan kelahiran. Lalu akan ada tiga populasi manusia, semuanya sama besar.
Ketiga populasi ini harus sama besar, karena tingkat orang yang meninggal dalam kecelakaan mobil (dari populasi pertama di atas) dan tingkat orang yang meninggal akibat serangan jantung (dari populasi ketiga di atas) adalah sama.
Jadi dalam kasus ini, hanya sepertiga dari semua orang yang hidup hari ini akan mati dalam kecelakaan mobil, sehingga kedua pernyataan itu tidak sama.
Dalam kehidupan nyata, kesan saya adalah bahwa kecelakaan mobil terjadi pada usia yang jauh lebih muda daripada kebanyakan penyebab kematian lainnya. Jika ini masalahnya, akan ada perbedaan besar antara angka-angka dalam pernyataan Anda satu dan dua.
Jika Anda mengubah pernyataan kedua menjadi
kemudian dengan asumsi populasi tunak, kedua pernyataan itu akan setara. Tetapi tentu saja, di dunia nyata kita tidak memiliki populasi dalam kondisi tunak, dan argumen serupa (walaupun lebih rumit) menunjukkan bahwa untuk populasi yang bertambah, atau menyusut, bias pengambilan sampel masih membuat kedua pernyataan ini berbeda.
sumber
Tidak.
Katakanlah kita memiliki 800 orang. 400 meninggal: 5 karena kecelakaan mobil, 395 lainnya lupa bernafas. S1 sekarang benar: 5/400 = 1/80. S2 salah: 5/800! = 1/80.
Masalahnya adalah bahwa secara teknis S2 ambigu karena tidak menentukan berapa banyak total kematian, sementara S1. Bergantian, S1 memiliki satu informasi lagi (total kematian) dan satu informasi kurang (total orang). Diambil pada nilai nominal, mereka menggambarkan rasio yang berbeda.
Saya sebenarnya tidak setuju dengan interpretasi Anda, tetapi saya pikir itu tidak masalah. Kemungkinan, konteks akan memperjelas apa yang dimaksud.
Anda mungkin bertanya di mana Anda bisa bertemu orang yang tidak mati. Untuk satu, kita bisa bekerja dengan dataset statistik yang hanya melacak orang selama 5 tahun, sehingga yang masih hidup pada akhir penelitian harus diabaikan, karena tidak diketahui dari mana mereka akan mati. Atau, penyebab kematian mungkin tidak diketahui, dalam hal ini Anda tidak dapat benar-benar menugaskannya ke mobil atau bukan mobil.
"Satu dari 80 orang yang meninggal, melakukannya karena kecelakaan mobil." yang berarti pengulangan S1.
sumber
Saya setuju bahwa interpretasi Anda terhadap pernyataan kedua konsisten dengan pernyataan pertama. Saya juga setuju bahwa itu adalah interpretasi yang sangat masuk akal dari pernyataan kedua. Yang sedang berkata, pernyataan kedua jauh lebih ambigu.
Pernyataan kedua juga dapat diartikan sebagai:
Penafsiran kedua dan ketiga di atas mungkin cukup dekat untuk khalayak awam, tetapi yang pertama sangat berbeda.
sumber
Perbedaan dasarnya adalah bahwa kedua pernyataan itu merujuk pada populasi manusia yang berbeda, dan kerangka waktu yang berbeda.
"Satu dari 80 kematian disebabkan oleh kecelakaan mobil" mungkin merujuk pada proporsi kematian dalam beberapa periode waktu yang cukup terbatas (katakanlah satu tahun). Karena proporsi dari total populasi yang menggunakan mobil, dan catatan keselamatan mobil, telah berubah secara signifikan dari waktu ke waktu, pernyataan itu tidak masuk akal kecuali Anda menyatakan interval waktu yang dimaksud. (Sebagai contoh yang konyol, jelas akan sangat salah untuk tahun 1919, mengingat tingkat kepemilikan dan penggunaan mobil dalam total populasi pada waktu itu). Catatan, "proporsi total populasi yang menggunakan mobil" di atas sebenarnya adalah kesalahan - seharusnya "proporsi orang yang akan mati dalam waktu dekat menggunakan mobil"
"Satu dari 80 orang meninggal akibat kecelakaan mobil" mungkin merujuk pada semua manusia yang saat ini hidup di suatu daerah, dan akhirnya menyebabkan kematian di beberapa waktu mendatang yang tidak diketahui. Karena prevalensi dan keamanan perjalanan mobil hampir pasti akan berubah dalam masa hidup mereka (katakanlah dalam 100 tahun ke depan, untuk bayi yang baru lahir saat ini), ini adalah pernyataan yang sangat berbeda dari yang pertama.
sumber
A1) Dengan asumsi semua orang mati, dan dengan asumsi konteks periode waktu yang cukup kecil di sekitar pengukuran yang dilakukan, ya, interpretasi Anda terhadap S2 cocok dengan S1.
A2) Ya, penafsiran Anda tentang S2 adalah sembrono. S2 dapat diartikan sebagai "1 dari 80 orang yang terlibat dalam kecelakaan mobil meninggal" yang jelas tidak setara dengan S1. Karena itu menggunakan S2 dapat menyebabkan kebingungan.
Penafsiran Anda dari 1 di 80 adalah wajar, meskipun, dan interpretasi lain (1 di setiap 80) sangat tidak biasa. "1 dalam N dari U adalah P" adalah singkatan yang sangat umum untuk "diberi predikat, P, dan N sampel acak, x, dari semesta U, jumlah sampel yang diharapkan sehingga P (x) benar kira-kira sama dengan 1" .
A3) Keluar jika semua orang, 1 dari 80 meninggal karena kecelakaan mobil.
sumber
Ya, itu salah, dan tidak ada ungkapan yang cukup untuk secara konsisten menyampaikan makna yang Anda inginkan
Berbicara sebagai orang awam, jika target Anda adalah orang awam, saya pasti akan merekomendasikan posting di https://english.stackexchange.com/ , alih-alih di sini - pertanyaan Anda membawa saya beberapa bacaan untuk menguraikan makna S1 & S2 secara intuitif bagi saya vs. apa yang ingin Anda katakan.
Sebagai catatan, interpretasi saya atas setiap pernyataan:
(S1) - per 80 kematian, 1 kematian karena kecelakaan mobil
(S2) - per 80 orang dalam kecelakaan mobil, 1 kematian
Untuk menyampaikan maksud Anda, saya kemungkinan akan menggunakan S2 yang dimodifikasi: "Satu dari 80 orang akan meninggal dalam kecelakaan mobil."
Ini masih mengandung beberapa ambiguitas, tetapi tetap singkat.
sumber