Menggambar n interval secara acak acak, probabilitas bahwa setidaknya satu interval tumpang tindih dengan yang lainnya

17

Gambarkan secara acak n interval dari , di mana setiap titik akhir A, B dipilih dari distribusi seragam antara .[0,1][0,1]

Berapa probabilitas bahwa setidaknya satu interval tumpang tindih dengan yang lain?

Vendetta
sumber
Anda dapat melihat probabilitas bahwa yang terakhir ditarik An lebih kecil dari minimum dari semua yang sebelumnya ditarik A , dan probabilitas bahwa terakhir Bn lebih besar dari maksimum dari semua yang sebelumnya ditarik B . Ini harus bermanfaat. Kemudian tingkatkan probabilitas untuk memperhitungkan fakta bahwa kita tidak membutuhkan yang terakhir , tetapi siapa pun. (Saya tidak punya waktu untuk menyelesaikannya, tetapi sepertinya ini adalah masalah kecil yang menyenangkan. Semoga berhasil!)
S. Kolassa - Reinstate Monica
Mungkin agak mengejutkan bahwa (1) jawabannya tidak bergantung pada distribusi (hanya bahwa itu berkelanjutan) dan (2) untuk n>1 itu konstan!
whuber
1
Apakah ini bagaimana interval n dikonstruksikan: i) menggambar dua angka secara acak dari [0,1], ii) biarkan yang lebih kecil menjadi An dan yang lebih besar Bn ?
ekvall

Jawaban:

5

Posting ini menjawab pertanyaan dan menguraikan kemajuan sebagian untuk membuktikannya dengan benar.


Untuk n=1 , jawabannya sepele adalah 1 . Untuk semua yang lebih besar , itu adalah (mengejutkan) selalu 2 / 3 .n2/3

Untuk melihat mengapa, pertama mengamati bahwa pertanyaan dapat digeneralisasi untuk setiap distribusi kontinu (di tempat distribusi seragam). Proses dimana interval n dihasilkan menghasilkan gambar 2 n iid variates X 1 , X 2 , , X 2 n dari F dan membentuk intervalFn2nX1,X2,,X2nF

[min(X1,X2),max(X1,X2)],,[min(X2n1,X2n),max(X2n1,X2n)].

Karena semua dari X i2nXi bersifat independen, keduanya dapat ditukar. Ini artinya solusinya akan sama jika kita secara acak mengubah mereka semua. Karena itu, mari kita syaratkan pada statistik pesanan yang diperoleh dengan mengurutkan :Xi

X(1)<X(2)<<X(2n)

(di mana, karena adalah kontinu, tidak ada peluang bahwa dua akan sama). The n interval dibentuk dengan memilih permutasi acak σ S 2 n dan menghubungkan mereka berpasanganFnσS2n

[min(Xσ(1),Xσ(2)),max(Xσ(1),Xσ(2))],,[min(Xσ(2n1),Xσ(2n)),max(Xσ(2n1),Xσ(2n))].

Apakah dua dari ini tumpang tindih atau tidak tidak tergantung pada nilai-nilai ,X(i) karena tumpang tindih dipertahankan oleh setiap transformasi monoton dan ada transformasi seperti itu yang mengirim X ( i ) ke i . Dengan demikian, tanpa kehilangan keumuman, kita dapat mengambil X ( i ) = i dan pertanyaannya menjadi:f:RRX(i)iX(i)=i

Biarkan set dipartisi menjadi n doublet yang terpisah. Dua dari mereka, { l 1 , r 1 } dan { l 2 , r 2 } (dengan l i < r i ), tumpang tindih ketika r 1 > l 2 dan r 2 > l 1{1,2,,2n1,2n}n{l1,r1}{l2,r2}li<rir1>l2r2>l1. Katakan bahwa partisi adalah "baik" ketika setidaknya salah satu elemennya tumpang tindih dengan yang lainnya (dan sebaliknya "buruk"). Sebagai fungsi dari , berapa proporsi partisi yang baik?n

Untuk menggambarkan, pertimbangkan kasus . Ada tiga partisi,n=2

{{1,2},{3,4}}, {{1,4},{2,3}}, {{1,3},{2,4}},

di mana dua yang bagus (yang kedua dan ketiga) berwarna merah. Dengan demikian jawaban dalam kasus adalah 2 / 3 .n=22/3

We may graph such partitions {{li,ri},i=1,2,,n} by plotting the points {1,2,,2n} on a number line and drawing line segments between each li and ri, offsetting them slightly to resolve visual overlaps. Here are plots of the preceding three partitions, in the same order with the same coloring:

Figure 1

Mulai sekarang, agar sesuai dengan plot seperti itu dengan mudah dalam format ini, saya akan mengubahnya ke samping. Sebagai contoh, berikut adalah partisi untuk n = 3 , sekali lagi dengan yang bagus berwarna merah:15n=3

Figure 2

Sepuluh baik, sehingga jawaban untuk adalah 10 / 15 = 2 / 3 .n=310/15=2/3

Situasi menarik pertama terjadi ketika . Sekarang, untuk pertama kalinya, dimungkinkan untuk penyatuan interval untuk rentang 1 hingga 2 n tanpa satu pun dari mereka memotong yang lain. Contohnya adalah { { 1 , 3 } , { 2 , 5 } , { 4 , 7 } , { 6 , 8 } } . Persatuan segmen garis tidak terputus dari 1 hingga 8n=412n{{1,3},{2,5},{4,7},{6,8}}18tapi ini bukan partisi yang bagus. Namun demikian, dari 105 partisi yang baik dan proporsi tetap 2 / 3 .701052/3


The number of partitions increases rapidly with n: it equals 1352n1=(2n)!/(2nn!). Exhaustive enumeration of all possibilities through n=7 continues to yield 2/3 as the answer. Monte-Carlo simulations through n=100 (using 10000 iterations in each) show no significant deviations from 2/3.

I am convinced there is a clever, simple way to demonstrate there is always a 2:1 ratio of good to bad partitions, but I have not found one. A proof is available through careful integration (using the original uniform distribution of the Xi), but it is rather involved and unenlightening.

whuber
sumber
Very cool. I have a hard time following what it means to "condition on the order statistics", would it be possible to add a line of intuition? Seems like a useful technique. I understand up to that the Xi are exchangeable, indeed even iid, that that this allows us to consider any permutation.
ekvall
1
@Student To "condition on" means to say, let's temporarily hold these values fixed and consider what we can learn from that. Later, we will let those values vary (according to their probability distribution). In this case, once we find that the answer is 2/3 regardless of the fixed values of the order statistics, then we no longer have to carry out the second step of varying the order statistics. Mathematically, the order stats are a vector-valued variable X and the indicator of being good is Y, so
E(Y)=E(E(Y|X))=E(2/3)=2/3.
whuber