Apa jawaban yang benar, jika kita memodifikasi "Pertanyaan statistik terbaik"?

8

Ada pertanyaan populer, yang disebut "Pertanyaan statistik terbaik".

Jika Anda memilih jawaban untuk pertanyaan ini secara acak, berapa peluang Anda akan benar?

A) 25% B) 50% C) 60% D) 25%

Tugas ini tidak terlalu sulit, jawaban yang benar adalah 0%. Tetapi jika kita memodifikasinya seperti ini:

Jika Anda memilih jawaban untuk pertanyaan ini secara acak, berapa peluang Anda akan benar?

A) 50% B) 25% C) 60% D) 50%

Apa jawaban yang benar? Apakah kita memiliki dua jawaban yang benar: 25% dan 50%, atau tidak ada jawaban yang benar, karena dengan dua jawaban yang benar ini kesempatan untuk memilih jawaban yang benar sebenarnya adalah 75% (tetapi kita tidak memiliki 75% tertulis di atas meja) )?

Ngomong-ngomong. Apakah jawaban 0% tetap merupakan jawaban yang benar, jawaban ketiga yang benar dalam kasus ini?

Nick
sumber
1
Jawabannya, tentu saja, tergantung pada bagaimana pilihan acak dibuat. "Secara acak" tidak selalu berarti "seragam secara acak" ...;)
MånsT
Mari kita asumsikan "seragam secara acak". Logika di balik pertanyaan awal adalah: Karena jawaban 25% memiliki probabilitas 50% untuk dipilih, dan jawaban 50% dan 60% memiliki probabilitas 25% untuk dipilih, jawaban ini tidak benar. Jawaban 0% benar, karena probabilitas untuk memilihnya adalah 0%.
Nick
2
Masalah ini dianalisis secara mendalam pada matematika. SE beberapa waktu lalu saya kembali.
kardinal
4
@whuber: Ini dia yang punya suara terbanyak . Ada yang lain, tapi mungkin mereka ditutup / digabung.
kardinal
2
@ Kardinal Terima kasih. Saya kira saya senang melihat tampaknya tidak ada balasan yang dalam atau menyinari di sana (meskipun ada pemungutan suara yang berat), karena itu berarti mungkin ada beberapa ruang untuk penafsiran lebih lanjut di sini :-).
whuber

Jawaban:

11

Paradoks yang tampak (logika atau probabilitas) dapat diselesaikan dengan membingkai pertanyaan dengan jelas dan hati-hati.

Analisis berikut dimotivasi oleh gagasan mempertahankan jawaban: ketika peserta tes dapat menunjukkan kemungkinan keadaan (konsisten dengan semua informasi yang tersedia) di mana jawaban mereka benar, maka itu harus ditandai sebagai benar. Secara ekuivalen, sebuah jawaban salah ketika tidak ada pembelaan semacam itu; itu dianggap benar sebaliknya. Ini memodelkan interaksi yang biasa antara siswa kelas (baik, rasional) dan peserta tes (rasional) :-). Paradoks yang tampak diselesaikan dengan menunjukkan beberapa pertahanan seperti itu untuk pertanyaan kedua, hanya satu yang bisa diterapkan dalam contoh apa pun.


Saya akan mengambil arti "acak" dalam pertanyaan-pertanyaan ini dalam pengertian konvensional: untuk memodelkan pilihan jawaban acak, saya akan menulis setiap jawaban pada selembar kertas ("tiket") dan memasukkannya ke dalam sebuah kotak: itu akan menjadi total empat tiket. Menarik tiket keluar dari kotak (setelah mengocok dengan hati-hati dan membabi buta isi kotak) adalah model fisik untuk pilihan "acak". Ini memotivasi dan membenarkan model probabilitas yang sesuai .

Sekarang, apa artinya "benar"? Dalam ketidaktahuan saya, saya akan mengeksplorasi semua kemungkinan. Bagaimanapun, saya menganggap bahwa nol, satu, atau bahkan lebih dari tiket mungkin "benar." (Bagaimana saya tahu? Saya cukup membaca lembar penilaian!) Saya akan menandai jawaban yang "benar" dengan menuliskan nilai pada setiap tiket yang benar dan menulis pada yang lainnya. Itu rutin dan jangan kontroversial.10

Suatu hal yang jelas tetapi penting untuk diperhatikan adalah bahwa aturan untuk menulis atau harus semata-mata didasarkan pada jawaban yang ditulis pada setiap tiket: secara matematis, ini adalah pemetaan (atau penugasan kembali) mengirimkan set jawaban yang terdaftar ( dalam kedua pertanyaan) ke dalam set . Aturan ini diperlukan untuk konsistensi diri.01{.25,.50,.60}{0,1}

Mari kita beralih ke elemen probabilistik dari pertanyaan: menurut definisi, peluang untuk menjadi benar, di bawah gambar tiket acak, adalah harapan dari nilai-nilai yang telah ditandai. Harapan dihitung dengan menjumlahkan nilai-nilai pada tiket dan membaginya dengan jumlah totalnya. Karena itu akan menjadi , , , , atau .0.25.50.751

Penandaan akan masuk akal asalkan hanya tiket yang jawabannya sama dengan harapan yang ditandai dengan detik1 . Ini juga merupakan persyaratan konsistensi diri. Saya mengklaim bahwa inilah inti masalahnya: untuk menemukan dan menafsirkan tanda-tanda yang masuk akal. Jika tidak ada, maka pertanyaan itu sendiri dapat dianggap tidak berarti. Kalau ada tanda yang unik, maka tidak akan ada kontroversi. Hanya jika dua atau lebih tanda masuk akal akan ada potensi kesulitan.

Tanda mana yang masuk akal?

Kami bahkan tidak perlu melakukan pencarian lengkap. Pada pertanyaan pertama , harapan yang tertera di tiket adalah 25%, 50% dan 60%. Yang terakhir tidak mungkin dengan empat tiket. Yang pertama akan membutuhkan tepat satu tiket untuk ditandai; yang kedua, dua tiket. Itu memberi paling banyak tanda yang mungkin untuk dijelajahi. Satu-satunya tanda yang masuk akal adalah s pada setiap tiket. Untuk penandaan ini, ekspektasinya adalah . Itu membenarkan jawaban yang dinyatakan untuk pertanyaan pertama. (Bisa dibilang, satu-satunya jawaban yang benar untuk pertanyaan pertama adalah tidak memilih jawaban apa pun!)3+3=60(0+0+0+0)/4=0

Dalam pertanyaan kedua , jawaban yang sama muncul dan sekali lagi ada enam tanda untuk dijelajahi. Kali ini, tiga tanda bersifat konsisten. Saya mentabulasikan mereka:

Solution 1                Solution 2                Solution 3
Ticket Answer Mark        Ticket Answer Mark        Ticket Answer Mark
     A    50%    1             A    50%    0             A    50%    0
     B    25%    0             B    25%    1             B    25%    0
     C    60%    0             C    60%    0             C    60%    0
     D    50%    1             D    50%    0             D    50%    0

Oleh karena itu, ada tiga kemungkinan definisi "benar" dalam masalah kedua, yang mengarah ke A atau D yang benar (dalam solusi 1) atau hanya B yang benar (dalam solusi 2), atau tidak ada jawaban yang benar (dalam solusi 3).

Salah satu cara untuk menafsirkan keadaan ini adalah bahwa untuk setiap jawaban A, B, dan D, ada setidaknya satu cara untuk menandai tiket yang membuat jawaban itu benar. Ini tidak menyiratkan bahwa ketiganya secara bersamaan benar: mereka tidak mungkin, karena . Jika Anda adalah penguji ujian, maka jika Anda menandai salah satu dari A, B, atau D yang benar, maka Anda tidak akan mendapatkan argumen dari penguji; tetapi jika Anda menandai salah satu dari mereka ,.25.50 peserta tes akan memiliki dasar yang sah untuk membantah skor Anda: mereka akan meminta solusi 1 atau solusi 2. Memang, jika peserta tes menolak untuk menjawab pertanyaan, solusi 3 akan memberi mereka dasar yang sah untuk menyatakan bahwa mereka tidak -respons juga harus mendapatkan kredit penuh!

Singkatnya, analisis ini membahas bagian kedua dari pertanyaan dengan menyimpulkan bahwa salah satu dari tanggapan berikut untuk pertanyaan 2 harus ditandai dengan benar karena masing-masing dapat dipertahankan : A, B, D, A dan D, dan tidak ada. Tidak ada respons lain yang dapat dipertahankan dan karenanya tidak akan benar.

whuber
sumber
1
Jadi apa jawaban Anda untuk pertanyaan 2? Sepertinya Anda telah memberikan penjelasan yang sangat rumit dengan tiga kemungkinan jawaban yang konsisten. Saya masih berpendapat bahwa ini menunjukkan masalah dengan definisi yang benar.
Michael R. Chernick
2
@Michael Terima kasih: Saya telah menambahkan paragraf untuk membuat kesimpulannya sangat jelas. Saya akan mengakui untuk membuat balasan yang relatif panjang (yang mungkin dibenarkan oleh panjangnya balasan yang jauh lebih besar di sini dan di situs matematika). "Sangat rumit" harus ada di mata yang melihatnya: Saya telah berusaha membuat ide-ide sesederhana mungkin sehingga pembaca dapat dengan mudah memeriksa bahwa saya tidak berusaha menipu mereka. Ketika orang lain mengklaim ada "paradoks" atau "pertanyaan dalam logika," penting untuk menjadi sederhana, jelas, dan eksplisit, meskipun hal itu dapat menambah panjangnya.
whuber
1
@Michael aku menghargainya. Saya agak malu tentang resolusi ini sendiri, karena orang tidak nyaman dengan gagasan bahwa ada beberapa jawaban yang benar untuk menghapus pertanyaan sederhana. Saya mengundang evaluasi kritis terhadap ide "defensibility" ini sebagai jalan keluar dari paradoks yang tampak. Bagi saya, sepertinya ini adalah cara asli untuk mengelak dari kesimpulan negatif yang dicapai oleh orang lain (yaitu, bahwa pertanyaan kedua tidak ada artinya, atau omong kosong, atau tidak logis). Nilai utama dari memeriksa paradoks terletak pada mendorong pemeriksaan yang lebih dalam dari ide-ide mendasar.
whuber
1
Ah, itu intinya, @Michael: meskipun ketiganya saling bertentangan, masing-masing bisa dipertahankan. Saya memberikan pembelaan dalam penjelasan yang mengarah ke solusi tabulasi. Mari kita menjadi praktis di sini: bayangkan Anda adalah seorang guru di lembaga Ivy League (di mana para siswa dan orang tua mereka, sayangnya, menjadi agak beragama dalam beberapa tahun terakhir) dan Anda telah memberikan pertanyaan seperti itu sebagai bagian dari ujian. Bagaimana Anda menilai mereka? Analisis saya menyarankan cara yang rasional, obyektif, adil, dan menghindari pertengkaran antara guru dan siswa - meskipun siswa mungkin berbeda di antara mereka sendiri!
whuber
2
Ada masalah Anda, @Michael: asumsi bahwa harus ada respons unik terhadap pertanyaan pilihan ganda. (Bicaralah dengan dokter yang Anda kenal dan tanyakan kepada mereka tentang pertanyaan pilihan ganda pada ujian sertifikasi dewan mereka: setidaknya di masa lalu, beberapa respons untuk setiap pertanyaan akan benar.) Di sini, kehadiran dua tanggapan yang identik dengan pertanyaan kedua menunjukkan kemungkinan bahwa lebih dari satu respons terhadap suatu pertanyaan dapat dianggap benar.// Pada titik ini kita tampaknya dalam bahaya menjauh dari masalah, jadi jika Anda memiliki komentar lebih lanjut, silakan mulai ruang obrolan.
whuber
9

Saya pikir ada masalah semantik di sini selain probabilitas. Memilih secara acak jelas. Masing-masing A, B, C, dan D akan dipilih 25%. Tapi apa artinya menjadi benar ketika Anda memilih secara acak? Tampaknya itu harus berarti mengingat bahwa Anda memilih A sebagai jawaban As memberikan% sampel yang benar yang akan benar dan sama untuk B, C, dan D. Jadi Anda harus menghitung 1/4 untuk setiap jawaban yang benar dan jumlah semua jawaban yang benar untuk mendapatkan persentase yang benar. Tapi ini mengarah pada argumen melingkar. Karena itu paradoksnya. Ini tampaknya lebih merupakan pertanyaan dalam logika daripada probabilitas atau statistik.

Michael R. Chernick
sumber
1
+1. Saya bertanya pada diri sendiri, "Tapi apa artinya menjadi benar ...?". Saya setuju ini tampaknya lebih merupakan teka-teki logika daripada pertanyaan probabilitas (walaupun saya ingin mendengar penjelasan dari seseorang tentang mengapa persepsi ini salah).
Makro
Logika di balik pertanyaan awal sama seperti yang telah Anda jelaskan. Karena jawaban 25% memiliki probabilitas 50% untuk dipilih, dan jawaban 50% dan 60% memiliki probabilitas 25% untuk dipilih, jawaban ini tidak benar. Jawaban 0% benar, karena probabilitas untuk memilihnya adalah 0%. Ini mengingatkan argumen melingkar, tetapi apakah ini membuat pertanyaan salah?
Nick
@Nick saya tidak berpikir begitu. Saya pikir argumen melingkar membuatnya tidak pasti. Anda tidak bisa mengatakan jawaban mana yang benar dan Anda tidak bisa mengatakan jawaban mana yang salah. Jadi 0% bukanlah jawabannya. Pertanyaannya tidak bisa dijawab. Mungkin Anda dapat mengatakan bahwa 60% salah karena jika ada jawaban itu harus kelipatan 1/4.
Michael R. Chernick
1

whuber memberikan analisis yang bagus di mana beberapa jawaban diizinkan. Namun, ada juga cara yang konsisten untuk memahami pertanyaan sehingga hanya ada satu jawaban yang benar (walaupun kita perlu menyatakan ini sebagai bagian dari pertanyaan):

Jika Anda memilih jawaban untuk pertanyaan ini secara acak, berapa peluang Anda akan benar, mengingat hanya ada satu jawaban yang benar?

A) 50% B) 25% C) 60% D) 50%

Sekali lagi, kita akan mendefinisikan jawaban "benar" sebagai jawaban yang dapat dipertahankan secara rasional dan akan mengikuti argumen whuber. Penandaan adalah peta dari himpunan jawaban ke sehingga jawaban yang benar dikirim ke 1 dan jawaban yang salah ke 0. Ada tiga kemungkinan tanda yang konsisten sendiri:{0,1}

Solution 1                Solution 2                Solution 3
Ticket Answer Mark        Ticket Answer Mark        Ticket Answer Mark
     A    50%    1             A    50%    0             A    50%    0
     B    25%    0             B    25%    1             B    25%    0
     C    60%    0             C    60%    0             C    60%    0
     D    50%    1             D    50%    0             D    50%    0

Namun kita membutuhkan langkah logis lain untuk mempersempitnya menjadi satu jawaban yang bisa dipertahankan. Ketika membuat masalah ini, guru dihadapkan dengan tiga tanda yang mungkin, yang masing-masing dapat sama sebagai jawaban tunggal yang dapat diterima sebagai yang lain. Namun, karena hanya satu jawaban yang benar, guru harus memilih secara acak di antara mereka. Ini memberikan probabilitas yang sama untuk setiap penandaan sehingga:

  • 1/3 dari waktu siswa akan benar dari waktu50%
  • 1/3 dari waktu siswa akan benar dari waktu25%
  • 1/3 dari waktu siswa akan benar dari waktu0%

Ini menghasilkan ekspektasi bahwa siswa akan benar % dari waktu. Dengan demikian 25% harus menjadi jawaban yang benar dan tanda untuk Solusi 2 harus dipilih. Ini adalah pembaruan yang konsisten dari diri guru sebelum tiga tanda yang memungkinkan, yaitu jika Solusi 2 ditetapkan menjadi tanda yang benar 100% dari waktu, maka 25% masih merupakan satu jawaban yang benar.(50+25+0)/3=25

Ringkasan: Jika kami menetapkan bahwa hanya ada satu jawaban yang benar, maka jawaban itu adalah 25%.

WJ Zeng
sumber
Bisakah Anda menjelaskan justifikasi untuk "Namun, karena hanya satu jawaban yang benar, guru harus memilih secara acak di antara mereka"? Saya tidak melihat mengapa pilihan acak diperlukan pada saat ini.
Whuber
Tentu saja ada kemungkinan bahwa guru dapat memiliki semacam bias, tetapi tidak ada alasan untuk berpikir bahwa ada bias. Dengan tidak adanya informasi lain, saya pikir rasional sebelum mengasumsikan adalah bahwa pilihan mengikuti distribusi yang seragam. Beri tahu saya jika ini keliru.
WJ Zeng
Saya tidak tahu apakah itu salah atau tidak, tetapi menyebutnya "prioritas rasional" sepertinya tidak ada penjelasan sama sekali. Yang menggangguku adalah bahwa untuk "menentukan bahwa hanya ada satu jawaban yang benar" dapat secara inheren bertentangan, dalam hal ini tidak ada distribusi sebelumnya yang relevan. Selain itu, garis besar logis dari argumen Anda tampaknya adalah "jika kita menganggap ada satu jawaban yang benar dan kami juga mengadopsi distribusi sebelumnya di antara tiga kemungkinan jawaban yang benar, maka kami menyimpulkan ada jawaban unik yang unik." Itu terlihat sangat melingkar, tapi mungkin itu bisa diperbaiki.
whuber
0

Saya yakin jawabannya 1/3. Kami tidak tahu jawaban mana (25%, 50%, atau 60%) yang benar. Jadi, setiap jawaban, 25%, 50%, dan 60% memiliki peluang 1/3 untuk menjadi benar jika dipilih. Meskipun 25% muncul dua kali, itu masih memiliki peluang 1/3 untuk menjadi jawaban yang benar. Sebenarnya tidak masalah berapa kali 25% muncul sebagai jawaban. Jika muncul 10 kali bersama dengan 50% dan 60%, kemungkinan itu adalah jawaban yang benar masih 1/3. Ini mengasumsikan bahwa salah satu jawaban itu benar. Jika ada kemungkinan tidak ada jawaban yang benar, maka jawabannya adalah 1/4. Ini berdasarkan interpretasi saya tentang apa yang ditanyakan.

Jamie
sumber
1
Upaya penjelasan gagal karena mengonfigurasi ketidaktahuan secara tidak valid (kami tidak tahu mana dari tiga jawaban yang akan benar) dengan probabilitas (memberikan 1/3 untuk setiap jawaban).
whuber