Terinspirasi oleh ceramah Peter Donnelly di TED , di mana ia membahas berapa lama untuk pola tertentu muncul dalam serangkaian lemparan koin, saya membuat skrip berikut dalam R. Diberikan dua pola 'hth' dan 'htt', itu menghitung berapa lama (yaitu berapa banyak lemparan koin) rata-rata sebelum Anda menekan salah satu pola ini.
coin <- c('h','t')
hit <- function(seq) {
miss <- TRUE
fail <- 3
trp <- sample(coin,3,replace=T)
while (miss) {
if (all(seq == trp)) {
miss <- FALSE
}
else {
trp <- c(trp[2],trp[3],sample(coin,1,T))
fail <- fail + 1
}
}
return(fail)
}
n <- 5000
trials <- data.frame("hth"=rep(NA,n),"htt"=rep(NA,n))
hth <- c('h','t','h')
htt <- c('h','t','t')
set.seed(4321)
for (i in 1:n) {
trials[i,] <- c(hit(hth),hit(htt))
}
summary(trials)
Statistik ringkasan adalah sebagai berikut,
hth htt
Min. : 3.00 Min. : 3.000
1st Qu.: 4.00 1st Qu.: 5.000
Median : 8.00 Median : 7.000
Mean :10.08 Mean : 8.014
3rd Qu.:13.00 3rd Qu.:10.000
Max. :70.00 Max. :42.000
Dalam ceramah itu dijelaskan bahwa rata-rata jumlah lemparan koin akan berbeda untuk dua pola; seperti yang bisa dilihat dari simulasi saya. Meskipun menonton pembicaraan beberapa kali saya masih belum mengerti mengapa ini akan terjadi. Saya mengerti bahwa 'hth' tumpang tindih dengan sendirinya dan secara intuitif saya akan berpikir bahwa Anda akan mencapai 'hth' lebih cepat dari 'htt', tetapi ini tidak terjadi. Saya akan sangat menghargainya jika seseorang dapat menjelaskan hal ini kepada saya.
sumber
Cara lain untuk melihatnya adalah bahwa setelah mencapai "HT", "T" akan mengirim "HTH" kembali ke awal, sementara "H" akan memulai kemajuan menjadi "HTT" yang mungkin.
Itu semakin buruk: dalam permainan Penney Anda memilih pola untuk balapan dan kemudian saya memilih yang lain. Jika Anda memilih "HTH" maka saya akan memilih "HHT" dan memiliki peluang menang 2: 1; jika Anda memilih "HTT" maka saya akan memilih "HHT" lagi dan masih memiliki peluang 2: 1 untuk saya. Tetapi jika Anda memilih "HHT" maka saya akan memilih "THH" dan memiliki peluang 3: 1. Pemain kedua selalu bias bias peluang, dan pilihan terbaik tidak transitif.
sumber
Saya suka menggambar.
Diagram-diagram ini adalah finite state automata (FSA). Mereka adalah permainan anak-anak kecil (seperti Chutes dan Ladders ) yang "mengenali" atau "menerima" urutan HTT dan HTH, masing-masing, dengan memindahkan token dari satu simpul ke simpul lain sebagai tanggapan terhadap flips koin. Token dimulai di simpul atas, ditunjukkan oleh panah (baris i ). Setelah setiap lemparan koin, token dipindahkan sepanjang tepi berlabel hasil koin itu (baik H atau T) ke node lain (yang saya sebut masing-masing "H node" dan "T node,"). Ketika token mendarat di terminal node (tidak ada panah keluar, ditunjukkan dengan warna hijau) permainan berakhir dan FSA telah menerima urutan.
Pikirkan setiap FSA sebagai maju secara vertikal ke jalur linier. Melemparkan urutan kepala dan ekor yang "benar" menyebabkan token berkembang menuju tujuannya. Memberi nilai yang "salah" menyebabkan token untuk dicadangkan (atau setidaknya diam). Token mencadangkan ke status paling maju yang sesuai dengan lemparan terbaru. Misalnya, HTT FSA pada baris ii tetap diletakkan pada baris ii setelah melihat kepala, karena kepala itu bisa menjadi urutan awal dari HTH akhirnya. Itu tidak berjalan jauh ke awal, karena itu akan secara efektif mengabaikan kepala terakhir ini sama sekali.
Setelah memverifikasi dua game ini memang sesuai dengan HTT dan HTH seperti yang diklaim, dan membandingkannya baris demi baris, dan sekarang jelas bahwa HTH lebih sulit untuk dimenangkan . Mereka berbeda dalam struktur grafis mereka hanya pada baris iii , di mana H mengambil HTT kembali ke baris ii (dan T menerima), tetapi dalam HTH, T membawa kita semua kembali ke garis i (dan H menerima). Penalti pada baris iii dalam memainkan HTH lebih berat daripada penalti dalam memainkan HTT.
Ini bisa diukur. Saya telah memberi label pada node dari kedua FSA ini dengan jumlah lemparan yang diharapkan untuk diterima. Mari kita sebut simpul ini "nilai." Pelabelan dimulai dengan
Biarkan probabilitas kepala menjadi p (H) dan probabilitas ekor menjadi 1 - p (H) = p (T). (Untuk koin yang adil, kedua probabilitas sama dengan 1/2.) Karena setiap flip koin menambahkan satu ke jumlah lemparan,
Aturan-aturan ini menentukan nilai . Latihan yang cepat dan informatif untuk memverifikasi bahwa nilai yang diberi label (dengan asumsi koin yang adil) sudah benar. Sebagai contoh, pertimbangkan nilai HTH pada saluran ii . Aturan mengatakan 8 harus 1 lebih dari rata-rata 8 (nilai simpul H pada baris i ) dan 6 (nilai simpul T pada baris iii ): cukup pasti, 8 = 1 + (1/2) * 8 + (1/2) * 6. Anda dapat dengan mudah memeriksa lima nilai yang tersisa dalam ilustrasi.
sumber
Beberapa jawaban bagus. Saya ingin mengambil cara yang sedikit berbeda, dan menjawab pertanyaan kontra-intuitif. (Saya cukup setuju, BTW)
Inilah cara saya memahaminya. Bayangkan sebuah kolom hasil lemparan koin sekuensial acak yang dicetak pada pita kertas, yang terdiri dari huruf "H" dan "T".
Merobek bagian kaset ini secara sewenang-wenang, dan membuat salinan yang identik.
Pada pita yang diberikan, urutan HTH dan urutan HTT masing-masing akan sering terjadi, jika rekaman itu cukup panjang.
Tetapi kadang-kadang instance HTH akan berjalan bersama, yaitu HTHTH. (atau bahkan sangat jarang HTHTHTH)
Tumpang tindih ini tidak dapat terjadi dengan instance HTT.
Gunakan stabilo untuk memilih "garis" dari hasil yang sukses, HTH pada satu kaset dan HTT pada yang lainnya. Beberapa strip HTH akan lebih pendek karena tumpang tindih. Akibatnya celah di antara mereka, rata-rata, akan sedikit lebih panjang daripada di kaset lainnya.
Ini seperti menunggu bus, ketika rata-rata ada satu setiap lima menit. Jika bus-bus dibiarkan saling tumpang tindih, interval rata-rata akan sedikit lebih lama dari lima menit, karena kadang-kadang dua akan melewati bersama.
Jika Anda tiba pada waktu yang sewenang-wenang, Anda akan menunggu sedikit lebih lama untuk bus berikutnya (untuk Anda, pertama), jika mereka diizinkan untuk tumpang tindih.
sumber
Saya sedang mencari intuisi untuk ini dalam kasus integer (seperti yang saya slogging melalui Ross 'Intro. To Probability Models). Jadi saya berpikir tentang kasus integer. Saya menemukan ini membantu:
Jadi, biarkan saya membayangkan bahwa saya memiliki kesempatan untuk menyelesaikan pola pada undian berikutnya. Saya menggambar simbol berikutnya dan tidak menyelesaikan polanya. Jika pola saya tidak tumpang tindih, simbol yang digambar mungkin masih memungkinkan saya untuk mulai membangun pola dari awal lagi.
Dalam kasus tumpang tindih, simbol yang saya butuhkan untuk menyelesaikan pola parsial saya sama dengan simbol yang saya perlukan untuk mulai membangun kembali. Jadi saya tidak bisa melakukan keduanya, dan karena itu pasti harus menunggu sampai undian berikutnya untuk kesempatan mulai membangun lagi.
sumber