Untuk memaksimalkan peluang menebak dengan benar hasil flip koin, haruskah saya selalu memilih hasil yang paling mungkin?

20

Ini bukan pekerjaan rumah. Saya tertarik untuk memahami apakah logika saya benar dengan masalah statistik sederhana ini.

Katakanlah saya memiliki koin 2 sisi di mana kemungkinan membalik kepala adalah P(H) dan probabilitas membalik ekor adalah 1P(H) . Mari kita asumsikan semua flips memiliki probabilitas independen. Sekarang, katakanlah saya ingin memaksimalkan peluang saya untuk memprediksi apakah koin akan menjadi kepala atau ekor pada flip berikutnya. Jika P(H)=0.5 , saya bisa menebak kepala atau ekor secara acak dan probabilitas saya benar adalah 0.5 .

Sekarang, anggaplah P(H)=0.2 , jika saya ingin memaksimalkan peluang menebak dengan benar, haruskah saya selalu menebak di mana probabilitasnya 0.8 ?

Mengambil langkah ini lebih jauh, jika saya memiliki dadu 3 sisi, dan kemungkinan menggulung 1, 2, atau, 3 adalah P(1)=0.1 , P(2)=0.5 , dan P(3)=0.4 , haruskah saya selalu menebak 2 untuk memaksimalkan peluang menebak dengan benar? Apakah ada pendekatan lain yang memungkinkan saya menebak dengan lebih akurat?

penyu
sumber
4
Kedengarannya bagi saya seperti Anda bertanya tentang kemerdekaan: misalnya jika Anda mendapatkan kepala sekali, apakah itu membuat 'ekor' lebih mungkin di waktu berikutnya? Jika ini bukan yang Anda tanyakan, dapatkah Anda mengklarifikasi pertanyaan Anda? (Jika saya telah memahami pertanyaan Anda dengan benar, jawabannya adalah 'ya': dalam situasi seperti koin melemparkan hasil yang paling mungkin akan selalu menjadi hasil dengan probabilitas tertinggi, terlepas dari apa yang telah terjadi sebelumnya.)
arboviral
Terima kasih atas bantuan @arboviral. Ya, saya mengasumsikan kemerdekaan. Saya telah memperbarui pertanyaan untuk menunjukkan ini.
kura
4
Dengan asumsi independensi, hal terbaik yang dapat Anda lakukan adalah memilih pihak dengan probabilitas tertinggi. Pikirkan seperti ini. Anda tidak memiliki informasi lain untuk membuat perkiraan yang lebih baik. Yang Anda tahu tentang dadu adalah seberapa sering pihak tertentu muncul dan apa yang dilemparkan pasangan terakhir. Tetapi independensi memberi tahu Anda bahwa baris sebelumnya tidak berpengaruh pada lemparan saat ini. Mungkin jika Anda memiliki informasi lebih lanjut seperti jumlah kekuatan yang digunakan untuk melempar dadu, pelempar tangan kiri / kanan, atau jumlah getar sebelum digulung. Namun jika dadu benar-benar adil, saya ragu bahkan tingkat detail akan memberikan prediksi yang lebih baik.
Brent Ferrier
Tebakan Anda benar; ini merupakan konsekuensi langsung dari Ketimpangan Pemegang (dengan parameter ). (1,)
whuber
Apakah Anda tahu bahwa P (H) = 0,2? Atau apakah itu sesuatu yang harus Anda pahami dengan mengamati hasilnya?
Akavall

Jawaban:

43

Kamu benar. Jika P(H)=0.2 , dan Anda menggunakan nol-satu kerugian (yaitu, Anda perlu menebak hasil aktual yang bertentangan dengan probabilitas atau sesuatu, dan lebih jauh lagi, mendapatkan kepala ketika Anda menebak ekor sama buruknya dengan mendapatkan ekor saat Anda menebak kepala), Anda harus menebak ekor setiap saat.

Orang sering keliru berpikir bahwa jawabannya adalah untuk menebak ekor dari 80% percobaan yang dipilih secara acak dan kepala sisanya. Strategi ini disebut " probabilitas cocok " dan telah dipelajari secara luas dalam pengambilan keputusan perilaku. Lihat, misalnya,

Barat, RF, & Stanovich, KE (2003). Apakah pencocokan probabilitas pintar? Hubungan antara pilihan probabilistik dan kemampuan kognitif. Memory & Cognition, 31 , 243–251. doi: 10.3758 / BF03194383

Kodiologis
sumber
1
+1 untuk penunjuk ke pencocokan probabilitas. Belum pernah mendengar itu sebelumnya, meskipun saya yakin saya memanfaatkannya setiap hari sebagai bias kognitif! :)
leekaiinthesky
2
(+1) Ini berhubungan dengan kesalahpahaman umum dalam menafsirkan model regresi multinomial & sejenisnya: orang dapat terkejut bahwa distribusi kelas yang diprediksi tidak cocok dengan distribusi kelas yang diamati, & bahkan mencari-cari cara untuk "memperbaikinya" . (Senang mengetahui itu memiliki nama.)
Scortchi - Reinstate Monica
1
(+1) untuk istilah "probabilitas yang cocok".
Haitao Du
13

Anda pada dasarnya mengajukan pertanyaan yang sangat menarik: haruskah saya memprediksi menggunakan "MAP Bayesian" Maksimum estimasi a posteriori atau "Real Bayesian".

P(H)=0.22080

argmaxθf(x|θ)

Tidak sulit untuk membuktikan bahwa dengan melakukan itu Anda dapat meminimalkan kesalahan yang diprediksi (kerugian 0-1). Buktinya dapat ditemukan di ~ halaman 53 dari Pengantar Pembelajaran Statistik .


Ada cara lain untuk melakukan ini yang disebut pendekatan "Bayesian Nyata". Pada dasarnya Anda tidak mencoba untuk "memilih hasil dengan probabilitas tertinggi, tetapi pertimbangkan semua kasus secara probablistis" Jadi, jika seseorang meminta Anda untuk "memprediksi 100 berikutnya", Anda harus menjeda dia, karena ketika Anda memberikan 100 hasil biner, informasi probabilistik untuk setiap hasil menghilang. Sebagai gantinya, Anda harus bertanya, apa yang ingin Anda lakukan SETELAH mengetahui hasilnya.

Misalkan dia memiliki beberapa Fungsi Kerugian (tidak perlu kerugian 0-1, misalnya, fungsi kerugian bisa, jika Anda kehilangan kepala, Anda harus membayar $ 1, tetapi jika Anda kehilangan ekor, Anda harus membayar $ 5, yaitu, ketidakseimbangan kerugian) pada prediksi Anda, maka Anda harus menggunakan pengetahuan Anda tentang distribusi hasil untuk meminimalkan kerugian atas seluruh distribusi

xyp(x,y)L(f(x),y)

, yaitu, sertakan pengetahuan Anda tentang distribusi ke kerugian, alih-alih "cara yang bijaksana", dapatkan prediksi dan lakukan langkah selanjutnya.

P(S1)=0.1P(S2)=P(S3)=P(S100)=0.9/99=0.009090S190%

Haitao Du
sumber
4
MAP juga Bayesian. Selain itu, Anda menggambarkan kedua pendekatan tanpa mengacu bagaimanapun untuk menggunakan prior apa yang dapat menyesatkan karena Anda menulis tentang metode Bayesian dan prior adalah yang fitur inti metode-metode.
Tim
'Jadi, jika seseorang meminta Anda untuk "memprediksi 100 berikutnya, Anda harus menolak untuk melakukan itu'. Jika seseorang itu menawari saya satu miliar euro jika saya memperkirakan dengan benar, saya mungkin tidak akan menolak. Atau mungkin yang Anda maksud 'memprediksi' dalam arti yang berbeda dari 'mencoba menebak'.
JiK
"ketika Anda memberikan 100 hasil biner, informasi probabilistik untuk setiap hasil menghilang" Pada awalnya saya membaca ini sebagai "ketika Anda diberi 100 hasil biner" dan tidak dapat memahami kalimatnya, tetapi sekarang saya menyadari itu mungkin berarti "ketika Anda memberikan 100 hasil biner ". Yang mana yang benar, dan jika itu yang pertama, apa artinya?
JiK
1
Poin yang sangat kecil: Saya mungkin akan menambahkan garis vertikal setelah paragraf kedua untuk menunjukkan bahwa dua paragraf pertama secara teknis cukup untuk menjawab pertanyaan literal dan sisanya adalah informasi tambahan (yang tidak diragukan lagi menarik dan bermanfaat).
JiK
2
Pada paragraf terakhir: "Perkiraan MAP tidak akan bekerja dengan baik jika jumlah hasilnya besar -. - Namun Anda akan salah 90% kali !!" Tidak berfungsi dengan baik selalu menjadi masalah konteks. Jika ini misalnya permainan taruhan berulang (pot dibagi di antara orang-orang yang menebak dengan benar atau kembali jika tidak ada yang menebak), strategi MAP terikat untuk memenangkan banyak uang dalam jangka panjang jika Anda bermain melawan orang-orang yang misalnya menggambar tebakan mereka dari distribusi hasil.
JiK
4

Karena independensi, nilai harapan Anda selalu dimaksimalkan jika Anda menebak kasus yang paling mungkin. Tidak ada strategi yang lebih baik karena setiap flip / roll tidak memberi Anda informasi tambahan tentang koin / mati.

Di mana pun Anda menebak kemungkinan hasil yang lebih kecil, harapan Anda untuk menang lebih kecil daripada jika Anda telah menebak kasus yang paling mungkin, sehingga Anda lebih baik hanya menebak kasus yang paling mungkin.

Jika Anda ingin membuatnya sehingga Anda perlu mengubah strategi Anda saat membalik, Anda mungkin mempertimbangkan koin / mati di mana Anda tidak tahu peluangnya pada awalnya dan Anda harus mengetahuinya saat Anda menggulung.

Kitter Catter
sumber
1
bagi saya jawaban ini adalah penjelasan paling sederhana; jika Anda harus mendefinisikan strategi dengan mempertimbangkan hasil yang Anda miliki sebelumnya, ini mematahkan probabilitas "independen".
Walfrat