Asumsikan kita memiliki titik dalam persegi panjang dengan batas , dan titik-titik ini terdistribusi secara merata di bidang ini. (Saya tidak begitu familiar dengan statistik, jadi saya tidak tahu perbedaan antara memilih secara seragam sebuah simpul di area , atau secara seragam memilih -aksi dari dan -aksi dari secara independen).
Diberi ambang jarak , saya mungkin ingin tahu probabilitas bahwa jarak dua titik 'Euclidean kurang dari , atau lebih tepatnya, berapa banyak pasangan node' jarak akan kurang dari ?
Mungkin uraian berikut tidak akan mendua.
Biarkan saya menentukan masalah ini. Diberikan node dan ambang batas . Ini poin didistribusikan secara merata dalam persegi panjang . Nyatakan variabel acak sebagai jumlah pasangan titik dalam jarak . Temukan .
sumber
probability
.Jawaban:
Kita dapat memecahkan masalah ini secara analitis menggunakan beberapa intuisi dan argumen geometris . Sayangnya, jawabannya cukup panjang dan agak berantakan.
Pengaturan dasar
Pertama, mari kita buat beberapa notasi. Asumsikan kita menggambar titik secara seragam secara acak dari kotak . Kami berasumsi tanpa kehilangan keumuman bahwa . Biarkan menjadi koordinat dari titik pertama dan menjadi koordinat dari titik kedua. Kemudian, , , , dan saling independen dengan didistribusikan secara seragam pada dan didistribusikan secara seragam pada .[0,a]×[0,b] 0<b<a (X1,Y1) (X2,Y2) X1 X2 Y1 Y2 Xi [0,a] Yi [0,b]
Pertimbangkan jarak Euclidean antara dua titik. Ini adalah manadan.
Distribusi segitiga
Karena dan adalah seragam independen, maka memiliki distribusi segitiga, di manamemiliki distribusi dengan fungsi kerapatan Fungsi distribusi yang sesuai adalah untuk . Demikian pula,memiliki kepadatan dan fungsi distribusi .X1 X2 X1−X2 Z1=|X1−X2|
Perhatikan bahwa karena adalah fungsi hanya dari dua dan adalah fungsi hanya dari , maka dan independen. Jadi jarak antara titik adalah norma euclidean dari dua variabel acak independen (dengan distribusi yang berbeda).Z1 Xi Z2 Yi Z1 Z2
Panel kiri gambar menunjukkan distribusi dan panel kanan menunjukkandi mana dalam contoh ini.X1−X2 Z1=|X1−X2| a=5
Beberapa probabilitas geometris
Jadi dan independen dan didukung pada danZ1 Z2 [0,a] [0,b] masing-masing. Untuk diperbaikid , fungsi distribusi jarak euclidean adalah
Kita dapat menganggap ini secara geometris memiliki distribusi pada persegi panjang dan mempertimbangkan seperempat lingkaran jari-jari . Kami ingin mengetahui probabilitas yang ada di dalam persimpangan dua wilayah ini. Ada tiga kemungkinan berbeda untuk dipertimbangkan:[0,a]×[0,b] d
Wilayah 1 (oranye): . Di sini lingkaran seperempat terletak sepenuhnya di dalam persegi panjang.0≤d<b
Wilayah 2 (merah): . Di sini lingkaran seperempat memotong persegi panjang di sepanjang tepi atas dan bawah.b≤d≤a
Wilayah 3 (biru): . Lingkaran seperempat memotong persegi panjang di sepanjang tepi atas dan kanan.a<d≤a2+b2−−−−−−√
Berikut adalah gambar, di mana kita menggambar contoh radius dari masing-masing dari ketiga jenis. Persegi panjang didefinisikan oleh , . Peta panas skala abu-abu dalam persegi panjang menunjukkan kepadatan mana area gelap memiliki kepadatan lebih tinggi dan area yang lebih terang memiliki kepadatan lebih kecil. Mengklik pada gambar akan membuka versi yang lebih besar.a=5 b=4 fa(z1)fb(z2)dz1dz2
Beberapa kalkulus jelek
Untuk menghitung probabilitas, kita perlu melakukan beberapa kalkulus. Mari kita pertimbangkan masing-masing daerah secara bergantian dan kita akan melihat bahwa integral yang sama akan muncul. Integral ini memiliki bentuk tertutup, meskipun tidak terlalu cantik.
Wilayah 1 : .0≤d<b
Sekarang, integral integral menghasilkan . Jadi, kita dibiarkan menghitung integral dari bentuk di mana dalam kasus ini bunga . Penangkal integrand adalah1a2d2−y2−−−−−−√(2a−d2−y2−−−−−−√)
Dari sini kita dapatkan .P(D≤d)=2a2b2(G(d)−G(0))
Wilayah 2 : .b≤d≤a
Wilayah 3 : .a<d≤a2+b2−−−−−−√
Di bawah ini adalah simulasi 20.000 titik di mana kami memplot distribusi empiris sebagai titik abu-abu dan distribusi teoretis sebagai garis, diwarnai sesuai dengan wilayah tertentu yang berlaku.
Dari simulasi yang sama, di bawah ini kami plot 100 pasang poin pertama dan menarik garis di antara mereka. Masing-masing diwarnai sesuai dengan jarak antara sepasang titik dan wilayah mana dari jarak ini.
Jumlah pasangan poin yang diharapkan dalam jarak hanyalah dengan linearitas harapan.d
sumber
Jika titik benar-benar terdistribusi secara seragam, yaitu dalam pola yang diketahui tetap, maka untuk jarak apa pun d, Anda dapat dengan mudah mengulang semua pasangan dan menghitung yang berada dalam jarak tersebut. Probabilitas Anda adalah (angka itu / n).
Jika Anda memiliki kebebasan tambahan untuk memilih bagaimana n poin didistribusikan / dipetik, maka ini adalah versi persegi panjang dari paradoks Bertrand . Halaman itu menunjukkan sejumlah cara untuk menjawab pertanyaan ini berdasarkan pada bagaimana Anda mendistribusikan poin Anda.
sumber