Inilah pertanyaannya:
Anda melempar dadu 6 sisi yang adil secara iteratif sampai jumlah gulungan dadu lebih besar dari atau sama dengan M. Apa rata-rata dan standar deviasi jumlah dikurangi M ketika M = 300?
Haruskah saya menulis kode untuk menjawab pertanyaan semacam ini?
Tolong beri saya beberapa petunjuk tentang itu. Terima kasih!
[self-study]
tag & baca wiki -nya . Kemudian beri tahu kami apa yang Anda pahami sejauh ini, apa yang telah Anda coba & di mana Anda terjebak. Kami akan memberikan petunjuk untuk membantu Anda melepaskan diri.Jawaban:
Anda tentu dapat menggunakan kode, tetapi saya tidak akan mensimulasikan.
Saya akan mengabaikan bagian "minus M" (Anda dapat melakukannya dengan cukup mudah di akhir).
Anda dapat menghitung probabilitas secara rekursif dengan sangat mudah, tetapi jawaban aktual (hingga tingkat akurasi yang sangat tinggi) dapat dihitung dari penalaran sederhana.
Biarkan gulungan menjadi . Misalkan S t = ∑ t i = 1 X i .X1,X2,... St=∑ti=1Xi
Biarkan menjadi indeks terkecil di mana S τ ≥ M .τ Sτ≥M
demikian pula
Persamaan yang mirip dengan yang pertama di atas kemudian dapat (setidaknya pada prinsipnya) dijalankan kembali sampai Anda menekan salah satu kondisi awal untuk mendapatkan hubungan aljabar antara kondisi awal dan probabilitas yang kita inginkan (yang akan membosankan dan tidak terlalu mencerahkan) , atau Anda dapat membuat persamaan maju yang sesuai dan menjalankannya dari kondisi awal, yang mudah dilakukan secara numerik (dan itulah cara saya memeriksa jawaban saya). Namun, kita bisa menghindari semua itu.
Probabilitas poin menjalankan rata-rata tertimbang dari probabilitas sebelumnya; ini akan (secara geometris cepat) menghaluskan segala variasi dalam probabilitas dari distribusi awal (semua probabilitas pada titik nol dalam kasus masalah kita). Itu
Artinya, probabilitasnya berada dalam rasio 6: 5: 4: 3: 2: 1, dan jumlah ke 1, jadi mereka sepele untuk dituliskan.
.Machine$double.eps
2.22e-16
Inilah kode saya untuk itu (sebagian besar hanya menginisialisasi variabel, pekerjaan semua dalam satu baris). Kode dimulai setelah gulungan pertama (untuk menyelamatkan saya memasukkan sel 0, yang merupakan gangguan kecil untuk ditangani dalam R); pada setiap langkah dibutuhkan sel terendah yang bisa ditempati dan bergerak maju dengan die roll (menyebarkan kemungkinan sel itu selama 6 sel berikutnya):
(kita dapat menggunakan
rollapply
(darizoo
) untuk melakukan ini dengan lebih efisien - atau sejumlah fungsi lain semacam itu - tetapi akan lebih mudah untuk menerjemahkan jika saya tetap eksplisit)Perhatikan bahwa
d6
ini adalah fungsi probabilitas diskrit lebih dari 1 hingga 6, sehingga kode di dalam loop di baris terakhir adalah membangun menjalankan rata-rata tertimbang dari nilai sebelumnya. Hubungan inilah yang membuat probabilitas menjadi lancar (hingga beberapa nilai terakhir yang kami minati).Dari distribusi probabilitas, rerata dan varians probabilitas kemudian sederhana.
sumber
Pada titik ini kita dapat memperdebatkan secara heuristik bahwa, untuk perkiraan yang sangat baik untuk semua kecuali terkecil ,Ini karena nilai yang diharapkan dari gulungan adalah dan timbal baliknya harus menjadi frekuensi jangka panjang yang membatasi dan stabil dari nilai tertentu di .M
Cara yang ketat untuk menunjukkan ini mempertimbangkan bagaimana bisa terjadi. Entah terjadi dan gulungan berikutnya adalah ; atau terjadi dan gulungan berikutnya adalah ; atau ... atau terjadi dan gulungan berikutnya adalah . Ini adalah partisi lengkap dari kemungkinan, dari manaEi Ei−1 1 Ei−2 2 Ei−6 6
Nilai awal dari urutan ini adalah
Plot melawan menunjukkan seberapa cepat peluang menetap ke konstan , ditunjukkan oleh garis putus-putus horisontal.Pr(Ei) i 2/7
Ada teori standar dari urutan rekursif tersebut. Ini dapat dikembangkan dengan cara menghasilkan fungsi, rantai Markov, atau bahkan manipulasi aljabar. Hasil umum adalah bahwa rumus bentuk tertutup untuk ada.Pr(Ei) Ini akan menjadi kombinasi linear dari konstanta dan kekuatan dari akar polinomialith
Magnitudo akar terbesar adalah sekitar . Dalam representasi floating point presisi ganda, pada dasarnya nol. Oleh karena itu, untuk , kita dapat mengabaikan semuanya kecuali konstanta. Konstanta ini adalah .exp ( - 36,05 ) i » - 36,05 / - 0,314368 = 115 2 / 7exp(−0.314368) exp(−36.05) i≫−36.05/−0.314368=115 2/7
Akibatnya, untuk , untuk semua tujuan praktis kita dapat mengambil , dari manaE M + k - j = 2 / 7M=300≫115 EM+k−j=2/7
Menghitung mean dan varian dari distribusi ini sangat mudah dan mudah.
Berikut ini adalahM+5=305 X300−300 χ2 0.1367
R
simulasi untuk mengkonfirmasi kesimpulan ini. Ini menghasilkan hampir 100.000 sekuens melalui , mentabulasikan nilai , dan menerapkan untuk menilai apakah hasilnya konsisten dengan yang sebelumnya. Nilai p (dalam hal ini) dari cukup besar untuk menunjukkan bahwa mereka konsisten.X 300 - 300 χ 2 0,1367sumber