Waktu yang dibutuhkan untuk mencapai pola kepala dan ekor dalam serangkaian lemparan koin

26

Terinspirasi oleh ceramah Peter Donnelly di TED , di mana ia membahas berapa lama untuk pola tertentu muncul dalam serangkaian lemparan koin, saya membuat skrip berikut dalam R. Diberikan dua pola 'hth' dan 'htt', itu menghitung berapa lama (yaitu berapa banyak lemparan koin) rata-rata sebelum Anda menekan salah satu pola ini.

coin <- c('h','t')

hit <- function(seq) {
    miss <- TRUE
    fail <- 3
    trp  <- sample(coin,3,replace=T)
    while (miss) {
        if (all(seq == trp)) {
            miss <- FALSE
        }
        else {
            trp <- c(trp[2],trp[3],sample(coin,1,T))
            fail <- fail + 1
        }
    }
    return(fail)
}

n <- 5000
trials <- data.frame("hth"=rep(NA,n),"htt"=rep(NA,n))

hth <- c('h','t','h')
htt <- c('h','t','t')

set.seed(4321)
for (i in 1:n) {
    trials[i,] <- c(hit(hth),hit(htt))    
}
summary(trials)

Statistik ringkasan adalah sebagai berikut,

      hth             htt        
 Min.   : 3.00   Min.   : 3.000  
 1st Qu.: 4.00   1st Qu.: 5.000  
 Median : 8.00   Median : 7.000  
 Mean   :10.08   Mean   : 8.014  
 3rd Qu.:13.00   3rd Qu.:10.000  
 Max.   :70.00   Max.   :42.000 

Dalam ceramah itu dijelaskan bahwa rata-rata jumlah lemparan koin akan berbeda untuk dua pola; seperti yang bisa dilihat dari simulasi saya. Meskipun menonton pembicaraan beberapa kali saya masih belum mengerti mengapa ini akan terjadi. Saya mengerti bahwa 'hth' tumpang tindih dengan sendirinya dan secara intuitif saya akan berpikir bahwa Anda akan mencapai 'hth' lebih cepat dari 'htt', tetapi ini tidak terjadi. Saya akan sangat menghargainya jika seseorang dapat menjelaskan hal ini kepada saya.

lafrasu
sumber

Jawaban:

32

Pikirkan tentang apa yang terjadi pertama kali Anda mendapatkan H diikuti oleh T.

Kasus 1: Anda sedang mencari HTH , dan Anda telah melihat HT untuk pertama kalinya. Jika lemparan berikutnya adalah H, Anda selesai. Jika T, Anda kembali ke titik awal: karena dua lemparan terakhir adalah TT, Anda sekarang memerlukan HTH lengkap.

Kasus 2: Anda mencari HTT , dan Anda telah melihat HT untuk pertama kalinya. Jika lemparan berikutnya adalah T, Anda selesai. Jika H, ​​ini jelas merupakan kemunduran; Namun, ini kecil karena Anda sekarang memiliki H dan hanya perlu -TT. Jika lemparan berikutnya adalah H, ini membuat situasi Anda tidak lebih buruk, sedangkan T membuatnya lebih baik, dan seterusnya.

Dengan kata lain, dalam kasus 2 H pertama yang Anda lihat membawa Anda 1/3 dari jalan, dan sejak saat itu Anda tidak perlu memulai dari awal. Ini tidak benar dalam kasus 1, di mana TT menghapus semua kemajuan yang Anda buat.

NPE
sumber
Ohh, jadi dalam skenario ini membalik koin tidak berhenti ketika satu pola menang! Itu masuk akal. Ini membingungkan saya untuk sementara waktu (belum menonton TED berbicara) jadi saya pikir saya akan berkomentar untuk membantu orang lain yang mungkin memikirkan hal yang sama.
15

8n+2nnHTHHTH

Cara lain untuk melihatnya adalah bahwa setelah mencapai "HT", "T" akan mengirim "HTH" kembali ke awal, sementara "H" akan memulai kemajuan menjadi "HTT" yang mungkin.

kk2k2+0+8=100+0+8=8

5

Itu semakin buruk: dalam permainan Penney Anda memilih pola untuk balapan dan kemudian saya memilih yang lain. Jika Anda memilih "HTH" maka saya akan memilih "HHT" dan memiliki peluang menang 2: 1; jika Anda memilih "HTT" maka saya akan memilih "HHT" lagi dan masih memiliki peluang 2: 1 untuk saya. Tetapi jika Anda memilih "HHT" maka saya akan memilih "THH" dan memiliki peluang 3: 1. Pemain kedua selalu bias bias peluang, dan pilihan terbaik tidak transitif.

Henry
sumber
+1 Terima kasih atas tautan ke game Penney; lebih banyak malam tanpa tidur :)
lafrasu
Henry yang terkasih, saya mengajukan pertanyaan serupa di situs ini, dan disuruh mencari jawaban di sini. Saya melihat permainan Penney, tetapi masih tidak bisa menyelesaikan masalah saya. Bantuan apa pun akan dihargai.
superAnnoyingUser
14

Saya suka menggambar.

masukkan deskripsi gambar di sini

Diagram-diagram ini adalah finite state automata (FSA). Mereka adalah permainan anak-anak kecil (seperti Chutes dan Ladders ) yang "mengenali" atau "menerima" urutan HTT dan HTH, masing-masing, dengan memindahkan token dari satu simpul ke simpul lain sebagai tanggapan terhadap flips koin. Token dimulai di simpul atas, ditunjukkan oleh panah (baris i ). Setelah setiap lemparan koin, token dipindahkan sepanjang tepi berlabel hasil koin itu (baik H atau T) ke node lain (yang saya sebut masing-masing "H node" dan "T node,"). Ketika token mendarat di terminal node (tidak ada panah keluar, ditunjukkan dengan warna hijau) permainan berakhir dan FSA telah menerima urutan.

Pikirkan setiap FSA sebagai maju secara vertikal ke jalur linier. Melemparkan urutan kepala dan ekor yang "benar" menyebabkan token berkembang menuju tujuannya. Memberi nilai yang "salah" menyebabkan token untuk dicadangkan (atau setidaknya diam). Token mencadangkan ke status paling maju yang sesuai dengan lemparan terbaru. Misalnya, HTT FSA pada baris ii tetap diletakkan pada baris ii setelah melihat kepala, karena kepala itu bisa menjadi urutan awal dari HTH akhirnya. Itu tidak berjalan jauh ke awal, karena itu akan secara efektif mengabaikan kepala terakhir ini sama sekali.

Setelah memverifikasi dua game ini memang sesuai dengan HTT dan HTH seperti yang diklaim, dan membandingkannya baris demi baris, dan sekarang jelas bahwa HTH lebih sulit untuk dimenangkan . Mereka berbeda dalam struktur grafis mereka hanya pada baris iii , di mana H mengambil HTT kembali ke baris ii (dan T menerima), tetapi dalam HTH, T membawa kita semua kembali ke garis i (dan H menerima). Penalti pada baris iii dalam memainkan HTH lebih berat daripada penalti dalam memainkan HTT.

Ini bisa diukur. Saya telah memberi label pada node dari kedua FSA ini dengan jumlah lemparan yang diharapkan untuk diterima. Mari kita sebut simpul ini "nilai." Pelabelan dimulai dengan

(1) menulis nilai jelas 0 pada node penerima.

Biarkan probabilitas kepala menjadi p (H) dan probabilitas ekor menjadi 1 - p (H) = p (T). (Untuk koin yang adil, kedua probabilitas sama dengan 1/2.) Karena setiap flip koin menambahkan satu ke jumlah lemparan,

(2) nilai suatu simpul sama dengan satu tambah p (H) dikali nilai simpul H ditambah p (T) dikali nilai dari simpul T.

Aturan-aturan ini menentukan nilai . Latihan yang cepat dan informatif untuk memverifikasi bahwa nilai yang diberi label (dengan asumsi koin yang adil) sudah benar. Sebagai contoh, pertimbangkan nilai HTH pada saluran ii . Aturan mengatakan 8 harus 1 lebih dari rata-rata 8 (nilai simpul H pada baris i ) dan 6 (nilai simpul T pada baris iii ): cukup pasti, 8 = 1 + (1/2) * 8 + (1/2) * 6. Anda dapat dengan mudah memeriksa lima nilai yang tersisa dalam ilustrasi.

whuber
sumber
Pendekatan FSA adalah cara yang bagus untuk menganalisis Penney's Game (dalam balasan oleh @Henry). Nilai diberi label sedikit berbeda: FSA sekarang memiliki satu simpul penerima per pola. Untuk menemukan peluang kemenangan pola Anda, beri label pada simpul penerima dengan 1 dan semua simpul penerima lainnya dengan 0. Nilai pada simpul lain sama dengan rata-rata nilai dari simpul H dan T. Nilai dari simpul mulai (unik) adalah peluang untuk menang.
whuber
0
@ung Terima kasih sudah menangkapnya. Saya perbaiki contohnya. Namun, ada kesalahan ketik pada gambar: sepertinya nilai HTT pada baris iii harus 4, bukan 2.
whuber
4

Beberapa jawaban bagus. Saya ingin mengambil cara yang sedikit berbeda, dan menjawab pertanyaan kontra-intuitif. (Saya cukup setuju, BTW)

Inilah cara saya memahaminya. Bayangkan sebuah kolom hasil lemparan koin sekuensial acak yang dicetak pada pita kertas, yang terdiri dari huruf "H" dan "T".

Merobek bagian kaset ini secara sewenang-wenang, dan membuat salinan yang identik.

Pada pita yang diberikan, urutan HTH dan urutan HTT masing-masing akan sering terjadi, jika rekaman itu cukup panjang.

Tetapi kadang-kadang instance HTH akan berjalan bersama, yaitu HTHTH. (atau bahkan sangat jarang HTHTHTH)

Tumpang tindih ini tidak dapat terjadi dengan instance HTT.

Gunakan stabilo untuk memilih "garis" dari hasil yang sukses, HTH pada satu kaset dan HTT pada yang lainnya. Beberapa strip HTH akan lebih pendek karena tumpang tindih. Akibatnya celah di antara mereka, rata-rata, akan sedikit lebih panjang daripada di kaset lainnya.

Ini seperti menunggu bus, ketika rata-rata ada satu setiap lima menit. Jika bus-bus dibiarkan saling tumpang tindih, interval rata-rata akan sedikit lebih lama dari lima menit, karena kadang-kadang dua akan melewati bersama.

Jika Anda tiba pada waktu yang sewenang-wenang, Anda akan menunggu sedikit lebih lama untuk bus berikutnya (untuk Anda, pertama), jika mereka diizinkan untuk tumpang tindih.

Andrew Troup
sumber
2

Saya sedang mencari intuisi untuk ini dalam kasus integer (seperti yang saya slogging melalui Ross 'Intro. To Probability Models). Jadi saya berpikir tentang kasus integer. Saya menemukan ini membantu:

A

B

A=BP(AB~)=0

ABP(AB~)0

Jadi, biarkan saya membayangkan bahwa saya memiliki kesempatan untuk menyelesaikan pola pada undian berikutnya. Saya menggambar simbol berikutnya dan tidak menyelesaikan polanya. Jika pola saya tidak tumpang tindih, simbol yang digambar mungkin masih memungkinkan saya untuk mulai membangun pola dari awal lagi.

Dalam kasus tumpang tindih, simbol yang saya butuhkan untuk menyelesaikan pola parsial saya sama dengan simbol yang saya perlukan untuk mulai membangun kembali. Jadi saya tidak bisa melakukan keduanya, dan karena itu pasti harus menunggu sampai undian berikutnya untuk kesempatan mulai membangun lagi.

dugaan
sumber