Kami menggulung dadu 6 sisi beberapa kali.
Menghitung selisih (nilai absolut) antara roll dan roll sebelumnya, apakah perbedaan diharapkan didistribusikan secara merata?
Untuk menggambarkan dengan 10 gulungan:
roll num result diff
1 1 0
2 2 1
3 1 1
4 3 2
5 3 0
6 5 2
7 1 4
8 6 5
9 4 2
10 4 0
Apakah diff
nilai - nilai akan terdistribusi secara seragam?
distributions
uniform
Hei jude
sumber
sumber
Jawaban:
Tidak, itu tidak seragam
Anda dapat menghitung36 kemungkinan yang kemungkinan sama untuk perbedaan absolut
yang memberikan distribusi probabilitas untuk perbedaan absolut
sumber
Dengan hanya menggunakan aksioma paling mendasar tentang probabilitas dan bilangan real, orang dapat membuktikan pernyataan yang jauh lebih kuat:
(Pernyataan analog untuk variabel kontinu dibuktikan pada Uniform PDF dari perbedaan dua rv .)
Idenya adalah bahwa peluangX−Y adalah nilai ekstrim harus lebih kecil daripada peluang bahwa X−Y adalah nol, karena hanya ada satu cara untuk (katakanlah) memaksimalkan X−Y sedangkan ada banyak cara untuk membuat perbedaan nol , karena X dan Y memiliki distribusi yang sama dan oleh karena itu dapat sama satu sama lain. Berikut detailnya.
Pertama amati bahwa dua variabel hipotetisX dan Y dalam pertanyaan masing-masing dapat mencapai hanya sejumlah n nilai dengan probabilitas positif, karena akan ada setidaknya n perbedaan yang berbeda dan distribusi yang seragam memberikan mereka semua probabilitas yang sama. Jika n tidak terbatas, maka akan menjadi jumlah perbedaan yang mungkin memiliki positif, probabilitas yang sama, di mana jumlah peluang mereka akan tak terbatas, yang tidak mungkin.
Selanjutnya , karena jumlah perbedaannya terbatas, akan ada yang terbesar di antara mereka. Perbedaan terbesar hanya dapat dicapai ketika mengurangi nilai terkecil dariY sebut saja m dan anggap memiliki probabilitas q=Pr(Y=m) --dari nilai terbesar panggilan X biarkan bahwa satu M dengan p=Pr(X=M). Karena X dan Y bersifat independen, peluang perbedaan ini adalah produk dari peluang ini,
Akhirnya , karenaX dan Y memiliki distribusi yang sama, ada banyak cara perbedaan mereka dapat menghasilkan nilai 0. Di antara cara ini kasus-kasus di mana X=Y=m dan X=Y=M. Karena distribusi ini nonconstant, m berbeda dari M. Itu menunjukkan kedua kasus tersebut merupakan peristiwa terpisah dan oleh karena itu mereka harus berkontribusi setidaknya sejumlah p2+q2 untuk kemungkinan bahwa X−Y adalah nol; itu adalah,
Karena kuadrat angka tidak negatif,0≤(p−q)2, dari mana kita simpulkan dari (∗) yang
menunjukkan distribusiX−Y tidak seragam, QED.
Edit dalam menanggapi komentar
Analisis serupa dari perbedaan absolut|X−Y| mengamati bahwa karena X dan Y memiliki distribusi yang sama, m=−M. Ini mengharuskan kita untuk mempelajari Pr(X−Y=|M−m|)=2pq. Teknik aljabar yang sama menghasilkan hasil yang hampir sama, tetapi ada kemungkinan bahwa 2pq=2pq+(p−q)2 dan2pq+p2+q2=1. Bahwa sistem persamaan memiliki unik solusip=q=1/2 sesuai dengan koin yang adil (a "dua sisi die"). Terlepas dari pengecualian ini, hasil untuk perbedaan absolut adalah sama dengan perbedaan, dan untuk alasan mendasar yang sama yang telah diberikan: yaitu, perbedaan absolut dari dua variabel acak iid tidak dapat didistribusikan secara seragam setiap kali ada lebih dari dua perbedaan perbedaan dengan probabilitas positif.
(akhir suntingan)
Mari kita terapkan hasil ini pada pertanyaan, yang menanyakan tentang sesuatu yang sedikit lebih rumit.
Model setiap roll independen dari die (yang mungkin mati tidak adil ) dengan variabel acakXi, i=1,2,…,n. Perbedaan yang diamati dalam n roll ini adalah angka ΔXi=Xi+1−Xi. Kita mungkin bertanya-tanya seberapa merata angka-angka n−1 ini. Itu benar-benar pertanyaan tentang ekspektasi statistik: berapa jumlah yang diharapkan dari ΔXi that are equal to zero, for instance? What is the expected number of ΔXi equal to −1 ? Etc., etc.
The problematic aspect of this question is that theΔXi are not independent: for instance, ΔX1=X2−X1 and ΔX2=X3−X2 involve the same roll X2.
However, this isn't really a difficulty. Since statistical expectation is additive and all differences have the same distribution, if we pick any possible valuek of the differences, the expected number of times the difference equals k in the entire sequence of n rolls is just n−1 times the expected number of times the difference equals k in a single step of the process. That single-step expectation is Pr(ΔXi=k) (for any i ). These expectations will be the same for all k (that is, uniform) if and only if they are the same for a single ΔXi. ΔXi has a uniform distribution, even when the die might be biased. Thus, even in this weaker sense of expected frequencies, the differences of the rolls are not uniform.
sumber
On an intuitive level, a random event can only be uniformly distributed if all of its outcomes are equally likely.
Is that so for the random event in question -- absolute difference between two dice rolls?
It suffices in this case to look at the extremes -- what are the biggest and smallest values this difference could take?
Obviously 0 is the smallest (we're looking at absolute differences and the rolls can be the same), and 5 is the biggest (
6
vs1
).We can show the event is non-uniform by showing that
0
is more (or less) likely to occur than5
.At a glance, there are only two ways for 5 to occur -- if the first dice is 6 and the second 1, or vice versa. How many ways can 0 occur?
sumber
As presented by Henry, differences of uniformly distributed distributions are not uniformly distributed.
To illustrate this with simulated data, we can use a very simple R script:
We see that this produces indeed a uniform distribution. Let's now have a look at the distribution of the absolute differences of two random samples from this distribution.
sumber
Others have worked the calculations, I will give you an answer that seems more intuitive to me. You want to study the sum of two unifrom r.v. (Z = X + (-Y)), the overall distribution is the (discrete) convolution product :
This sum is rather intuitive : the probability to getz , is the sum of the probabilities to get something with X (noted k here) and the complement to z with -Y.
From signal processing, we know how the convolution product behave:
You can understand what happen here : asz move up (the vertical dotted line) the common domain of both rectangle move up then down, which correspond to the probability to get z .
More generally we know that the only functions that are stable by convolution are those of the gaussian familly. i.e. Only gaussian distribution are stable by addition (or more generally, linear combination). This is also meaning that you don't get a uniform distribution when combining uniform distributions.
As to why we get those results, the answer lies in the Fourrier decomposition of those functions. The Fourrier transformation of a convolution product being the simple product of the Fourrier transformations of each function. This give direct links between the fourrier coefficients of the rectangle and triangle functions.
sumber
Ifx and y are two consecutive dice rolls, you can visualize |x−y|=k (for k=0,1,2,3,4,5 ) as follows where each color corresponds to a different value of k :
As you can easily see, the number of points for each color is not the same; therefore, the differences are not uniformly distributed.
sumber
LetDt denote the difference and X the value of the roll, then
P(Dt=5)=P(Xt=6,Xt−1=1)<P((Xt,Xt−1)∈{(6,3),(5,2)})<P(Dt=3)
So the functionP(Dt=d) is not constant in d . This means that the distribution is not uniform.
sumber