Ambil 5 benda padat Platonis dari serangkaian dadu Dungeons & Dragons. Ini terdiri dari dadu 4 sisi, 6 sisi (konvensional), 8 sisi, 12 sisi, dan 20 sisi. Semua mulai dari angka 1 dan hitung ke atas sebanyak 1 hingga totalnya.
Gulung semuanya sekaligus, ambil jumlah mereka (jumlah minimum adalah 5, maks adalah 50). Lakukan berkali-kali. Apa distribusinya?
Jelas mereka akan cenderung ke arah yang lebih rendah, karena ada angka yang lebih rendah daripada yang lebih tinggi. Tetapi apakah akan ada titik perubahan penting di setiap batas individu yang mati?
[Sunting: Rupanya, apa yang tampak jelas bukan. Menurut salah satu komentator, rata-rata adalah (5 + 50) /2=27.5. Saya tidak mengharapkan ini. Saya masih ingin melihat grafik.] [Sunting2: Lebih masuk akal untuk melihat bahwa distribusi n dadu sama dengan setiap dadu secara terpisah, ditambahkan bersama-sama.]
sumber
hist(rowSums(sapply(c(4, 6, 8, 12, 20), sample, 1e6, replace = TRUE)))
. Itu sebenarnya tidak cenderung ke arah yang rendah; dari nilai yang mungkin dari 5 hingga 50, rata-rata adalah 27,5, dan distribusinya (secara visual) tidak jauh dari normal.Jawaban:
Saya tidak ingin melakukannya secara aljabar, tetapi Anda dapat menghitung PMF cukup sederhana (ini hanya konvolusi, yang sangat mudah dalam spreadsheet).
Saya menghitung ini dalam spreadsheet *:
Di sini adalah jumlah cara untuk mendapatkan setiap total i ; p ( i ) adalah probabilitas, di mana p ( i ) = n ( i ) / 46080 . Hasil yang paling mungkin terjadi kurang dari 5% dari waktu.n(i) i p(i) p(i)=n(i)/46080
Sumbu-y adalah probabilitas yang dinyatakan sebagai persentase.
* Metode yang saya gunakan mirip dengan prosedur yang diuraikan di sini , meskipun mekanisme yang tepat terlibat dalam pengaturannya berubah sebagai rincian antarmuka pengguna berubah (posting itu sekitar 5 tahun sekarang meskipun saya memperbaruinya sekitar setahun yang lalu). Dan saya menggunakan paket yang berbeda kali ini (saya melakukannya di LibreOffice's Calc saat ini). Namun, itulah intinya.
sumber
Jadi saya membuat kode ini:
Hasilnya adalah plot ini.
Ini terlihat cukup Gaussian. Saya pikir kita (lagi) mungkin telah menunjukkan variasi pada teorema limit pusat.
sumber
A little help to your intuition:
First, consider what happens if you add one to all the faces of one die, e.g. the d4. So, instead of 1,2,3,4, the faces now show 2,3,4,5.
Comparing this situation to the original, it is easy to see that the total sum is now one higher than it used to be. This means that the shape of the distribution is unchanged, it is just moved one step to the side.
Now subtract the average value of each die from every side of that die.
This gives dice marked
etc.
Now, the sum of these dice should still have the same shape as the original, only shifted downwards. It should be clear that this sum is symmetrical around zero. Therefore the original distribution is also symmetrical.
sumber
I will show an approach to do this algebraically, with the aid of R. Assume the different dice have probability distributions given by vectors
and you can check that that is correct (by hand calculation). Now for the real question, five dice with 4,6,8,12,20 sides. I will do the calculation assuming uniform probs for each dice. Then:
The plot is shown below:
Now you can compare this exact solution with simulations.
sumber
The Central Limit Theorem answers your question. Though its details and its proof (and that Wikipedia article) are somewhat brain-bending, the gist of it is simple. Per Wikipedia, it states that
Sketch of a proof for your case:
When you say “roll all the dice at once,” each roll of all the dice is a random variable.
Your dice have finite numbers printed on them. The sum of their values therefore has finite variance.
Every time you roll all the dice, the probability distribution of the outcome is the same. (The dice don’t change between rolls.)
If you roll the dice fairly, then every time you roll them, the outcome is independent. (Previous rolls don’t affect future rolls.)
Independent? Check. Identically distributed? Check. Finite variance? Check. Therefore the sum tends toward a normal distribution.
It wouldn’t even matter if the distribution for one roll of all dice were lopsided toward the low end. I wouldn’t matter if there were cusps in that distribution. All the summing smooths it out and makes it a symmetrical gaussian. You don’t even need to do any algebra or simulation to show it! That’s the surprising insight of the CLT.
sumber