Biarkan batang dengan panjang 1 dipecah dalam fragmen secara seragam secara acak. Berapa distribusi panjang fragmen terpanjang?
Secara lebih formal, biarkan menjadi IID , dan biarkan menjadi statistik pesanan terkait, yaitu kami cukup memesan sampel sedemikian rupa sehingga . Biarkan .
Saya tertarik pada distribusi . Momen, hasil asimptotik, atau perkiraan untuk juga menarik.
Jawaban:
Dengan informasi yang diberikan oleh @Glen_b saya bisa menemukan jawabannya. Menggunakan notasi yang sama dengan pertanyaan
di manaa+=a jika a>0 dan 0 sebaliknya. Saya juga memberikan ekspektasi dan konvergensi asimptotik pada distribusi Gumbel ( NB : bukan Beta)
Bahan bukti diambil dari beberapa publikasi yang terhubung dalam referensi. Mereka agak panjang, tapi langsung.
1. Bukti distribusi yang tepat
Misalkan menjadi variabel acak seragam IID dalam interval . Dengan memesannya , kami memperoleh statistik order yang dilambangkan . Jarak seragam didefinisikan sebagai , dengan dan . Spasi yang diurutkan adalah statistik yang diurutkan sesuai . Variabel yang menarik adalah .(U1,…,Uk) (0,1) k (U(1),…,U(k)) Δi=U(i)−U(i−1) U(0)=0 U(k+1)=1 Δ ( k + 1 )Δ(1)≤…≤Δ(k+1) Δ(k+1)
Untuk tetap> , kami mendefinisikan variabel indikator . Secara simetri, vektor acak dapat ditukar, sehingga distribusi gabungan dari subset ukuran adalah sama dengan distribusi gabungan dari pertama . Dengan memperluas produk, dengan demikian kita memperoleh1 i = 1 { Δ i > x } ( 1 1 , ... , 1 k + 1 ) j jx∈(0,1) 1i=1{Δi>x} (11,…,1k+1) j j
Kami sekarang akan membuktikan bahwa , yang akan menetapkan distribusi yang diberikan di atas. Kami membuktikan ini untuk , karena kasus umum terbukti sama. j = 2E( ∏ji = 11saya) =(1-jx )k+ j = 2
Jika , breakpoints berada dalam interval . Secara kondisional pada peristiwa ini, breakpoints masih dapat ditukar, sehingga probabilitas bahwa jarak antara breakpoint kedua dan pertama lebih besar dari sama dengan probabilitas bahwa jarak antara breakpoint pertama dan penghalang kiri (pada posisi ) lebih besar dari . Begituk ( x , 1 ) x x xΔ1>x k (x,1) x x x
2. Ekspektasi
Untuk distribusi dengan dukungan terbatas, kita harus
Mengintegrasikan distribusi , kita memperolehΔ(k+1)
Kesetaraan terakhir adalah representasi klasik dari angka harmonik , yang kami tunjukkan di bawah ini.Hi=1+12+…+1i
Dengan perubahan variabel dan memperluas produk, kita memperolehu=1−x
3. konstruksi Alternatif jarak seragam
Untuk mendapatkan distribusi asimtotik dari fragmen terbesar, kita perlu menunjukkan konstruksi klasik jarak seragam sebagai variabel eksponensial dibagi dengan jumlah mereka. Kepadatan probabilitas dari statistik pesanan terkait adalah(U(1),…,U(k))
Jika kita menunjukkan spasi yang seragam , dengan , kita memperoleh U ( 0 ) = 0Δi=U(i)−U(i−1) U(0)=0
Dengan mendefinisikan , dengan demikian kita memperolehU( k + 1 )= 1
Sekarang, mari menjadi variabel acak eksponensial IID dengan rata-rata 1, dan biarkan . Dengan perubahan variabel sederhana, kita bisa melihatnyaS = X 1 + ... + X k + 1( X1, ... , Xk + 1) S= X1+ ... + Xk + 1
Tentukan , sehingga oleh perubahan variabel kita memperolehYi=Xi/S
Mengintegrasikan density ini sehubungan dengan , dengan demikian kita memperolehs
Jadi distribusi bersama jarak seragam pada interval adalah sama dengan distribusi bersama variabel acak eksponensial dibagi dengan jumlah mereka. Kami sampai pada kesetaraan distribusi berikut( 0 , 1 ) k + 1k+1 (0,1) k+1
4. Distribusi asimptotik
Dengan menggunakan persamaan di atas, kami memperoleh
di mana . Variabel ini menghilang dalam probabilitas karena dan . Secara asimptotik, distribusinya sama dengan . Karena adalah IID, kami punyaTk+1=X1+…+Xk+1k+1−1 E( Tk + 1) = 0 Va r ( log( k + 1 ) Tk + 1) = ( log( k + 1 ) )2k + 1↓ 0 X( k + 1 )- log( k + 1 ) Xsaya
5. Tinjauan grafis
Plot di bawah ini menunjukkan distribusi fragmen terbesar untuk nilai berbeda . Untuk , saya juga menimpakan distribusi Gumbel asimptotik (garis tipis). Gumbel adalah perkiraan yang sangat buruk untuk nilai-nilai kecil jadi saya menghilangkannya untuk tidak membebani gambar. Perkiraan Gumbel baik dari .k k=10,20,50 k k≈50
6. Referensi
Bukti di atas diambil dari referensi 2 dan 3. Literatur yang dikutip memuat lebih banyak hasil, seperti distribusi ruang yang dipesan dari peringkat apa pun, distribusi batasnya dan beberapa konstruksi alternatif dari jarak seragam yang dipesan. Referensi utama tidak mudah diakses, jadi saya juga menyediakan tautan ke teks lengkap.
sumber
Ini bukan jawaban yang lengkap, tetapi saya melakukan beberapa simulasi cepat, dan inilah yang saya peroleh:
Ini terlihat sangat beta, dan ini masuk akal, karena statistik urutan distribusi seragam iid adalah beta wiki .
Ini mungkin memberikan beberapa titik awal untuk mendapatkan pdf yang dihasilkan.
Saya akan memperbarui jika saya mendapatkan solusi tertutup akhir.
Tepuk tangan!
sumber
Saya menghasilkan jawaban untuk sebuah konferensi di Siena (Italia) pada tahun 2005. Makalah (2006) disajikan di situs web saya di sini (pdf) . Distribusi tepat dari semua jarak (terkecil ke terbesar) dapat ditemukan di halaman 75 & 76.
Saya berharap dapat memberikan presentasi tentang topik ini di Konferensi RSS di Manchester (Inggris) pada bulan September 2016.
sumber