Distribusi fragmen terbesar dari tongkat patah (jarak)

21

Biarkan batang dengan panjang 1 dipecah dalam fragmen secara seragam secara acak. Berapa distribusi panjang fragmen terpanjang?k+1

Secara lebih formal, biarkan menjadi IID , dan biarkan menjadi statistik pesanan terkait, yaitu kami cukup memesan sampel sedemikian rupa sehingga . Biarkan .(U1,Uk)U(0,1)(U(1),,U(k))U(1)U(2),,U(k)Zk=max(U(1),U(2)U(1),,U(k)U(k1),1U(k))

Saya tertarik pada distribusi Zk . Momen, hasil asimptotik, atau perkiraan untuk k juga menarik.

gui11aume
sumber
9
Ini adalah masalah yang dipelajari dengan baik; lihat R. Pyke (1965), "Spacings," JRSS (B) 27 : 3, hlm. 395-449. Saya akan mencoba untuk datang kembali untuk menambahkan beberapa informasi kemudian kecuali seseorang mengalahkan saya untuk itu. Ada juga makalah 1972 oleh penulis yang sama (" Spacings revisited ") tapi saya pikir apa yang Anda cari hampir semuanya ada di awal. Ada beberapa asimtotik dalam Devroye (1981) , "Hukum Logaritma Iterated untuk Statistik Order dari Penempatan Seragam" Ann. Mungkin. , 9 : 5, 860-867.
Glen_b -Reinstate Monica
4
Itu juga harus memberikan beberapa istilah pencarian yang baik untuk menemukan kemudian bekerja jika Anda membutuhkannya.
Glen_b -Reinstate Monica
3
Ini luar biasa. Referensi pertama sulit ditemukan. Bagi yang berminat, saya menaruhnya di The Grand Locus .
gui11aume
Harap perbaiki salah cetak: Y(k) alih-alih U(k) .
Viktor
Terima kasih @ Viktor! Untuk hal-hal kecil seperti itu, jangan ragu untuk melakukan pengeditan sendiri (saya pikir itu akan ditinjau oleh pengguna lain untuk persetujuan).
gui11aume

Jawaban:

18

Dengan informasi yang diberikan oleh @Glen_b saya bisa menemukan jawabannya. Menggunakan notasi yang sama dengan pertanyaan

P(Zkx)=j=0k+1(k+1j)(1)j(1jx)+k,

di mana a+=a jika a>0 dan 0 sebaliknya. Saya juga memberikan ekspektasi dan konvergensi asimptotik pada distribusi Gumbel ( NB : bukan Beta)

E(Zk)=1k+1i=1k+11ilog(k+1)k+1,P(Zkx)exp(e(k+1)x+log(k+1)).

Bahan bukti diambil dari beberapa publikasi yang terhubung dalam referensi. Mereka agak panjang, tapi langsung.

1. Bukti distribusi yang tepat

Misalkan menjadi variabel acak seragam IID dalam interval . Dengan memesannya , kami memperoleh statistik order yang dilambangkan . Jarak seragam didefinisikan sebagai , dengan dan . Spasi yang diurutkan adalah statistik yang diurutkan sesuai . Variabel yang menarik adalah .(U1,,Uk)(0,1)k(U(1),,U(k))Δi=U(i)U(i1)U(0)=0U(k+1)=1 Δ ( k + 1 )Δ(1)Δ(k+1)Δ(k+1)

Untuk tetap> , kami mendefinisikan variabel indikator . Secara simetri, vektor acak dapat ditukar, sehingga distribusi gabungan dari subset ukuran adalah sama dengan distribusi gabungan dari pertama . Dengan memperluas produk, dengan demikian kita memperoleh1 i = 1 { Δ i > x } ( 1 1 , ... , 1 k + 1 ) j jx(0,1)1i=1{Δi>x}(11,,1k+1)jj

P(Δ(k+1)x)=E(saya=1k+1(1-1saya))=1+j=1k+1(k+1j)(-1)jE(saya=1j1saya).

Kami sekarang akan membuktikan bahwa , yang akan menetapkan distribusi yang diberikan di atas. Kami membuktikan ini untuk , karena kasus umum terbukti sama. j = 2E(saya=1j1saya)=(1-jx)+kj=2

E(i=121i)=P(Δ1>xΔ2>x)=P(Δ1>x)P(Δ2>x|Δ1>x).

Jika , breakpoints berada dalam interval . Secara kondisional pada peristiwa ini, breakpoints masih dapat ditukar, sehingga probabilitas bahwa jarak antara breakpoint kedua dan pertama lebih besar dari sama dengan probabilitas bahwa jarak antara breakpoint pertama dan penghalang kiri (pada posisi ) lebih besar dari . Begituk ( x , 1 ) x x xΔ1>xk(x,1)xxx

P(Δ2>x|Δ1>x)=P(all points are in (2x,1)|all points are in (x,1)),soP(Δ2>xΔ1>x)=P(all points are in (2x,1))=(12x)+k.

2. Ekspektasi

Untuk distribusi dengan dukungan terbatas, kita harus

E(X)=P(X>x)dx=1P(Xx)dx.

Mengintegrasikan distribusi , kita memperolehΔ(k+1)

E(Δ(k+1))=1k+1j=1k+1(k+1j)(1)j+1j=1k+1j=1k+11j.

Kesetaraan terakhir adalah representasi klasik dari angka harmonik , yang kami tunjukkan di bawah ini.Hi=1+12++1i

Hk+1=011+x++xkdx=011xk+11xdx.

Dengan perubahan variabel dan memperluas produk, kita memperolehu=1x

Hk+1=01j=1k+1(k+1j)(1)j+1uj1du=j=1k+1(k+1j)(1)j+1j.

3. konstruksi Alternatif jarak seragam

Untuk mendapatkan distribusi asimtotik dari fragmen terbesar, kita perlu menunjukkan konstruksi klasik jarak seragam sebagai variabel eksponensial dibagi dengan jumlah mereka. Kepadatan probabilitas dari statistik pesanan terkait adalah(U(1),,U(k))

fU(1),U(k)(u(1),,u(k))=k!,0u(1)u(k+1).

Jika kita menunjukkan spasi yang seragam , dengan , kita memperoleh U ( 0 ) = 0Δi=U(i)U(i1)U(0)=0

fΔ1,...Δk(δ1,...,δk)=k!,0δsaya+...+δk1.

Dengan mendefinisikan , dengan demikian kita memperolehU(k+1)=1

fΔ1,...Δk+1(δ1,...,δk+1)=k!,δ1+...+δk=1.

Sekarang, mari menjadi variabel acak eksponensial IID dengan rata-rata 1, dan biarkan . Dengan perubahan variabel sederhana, kita bisa melihatnyaS = X 1 + ... + X k + 1(X1,...,Xk+1)S=X1+...+Xk+1

fX1,Xk,S(x1,,xk,s)=es.

Tentukan , sehingga oleh perubahan variabel kita memperolehYi=Xi/S

fY1,Yk,S(y1,,yk,s)=skes.

Mengintegrasikan density ini sehubungan dengan , dengan demikian kita memperolehs

fY1,Yk,(y1,,yk)=0skesds=k!,0yi++yk1,and thusfY1,Yk+1,(y1,,yk+1)=k!,y1++yk+1=1.

Jadi distribusi bersama jarak seragam pada interval adalah sama dengan distribusi bersama variabel acak eksponensial dibagi dengan jumlah mereka. Kami sampai pada kesetaraan distribusi berikut( 0 , 1 ) k + 1k+1(0,1)k+1

Δ(k+1)X(k+1)X1++Xk+1.

4. Distribusi asimptotik

Dengan menggunakan persamaan di atas, kami memperoleh

P((k+1)Δ(k+1)log(k+1)x)=P(X(k+1)(x+log(k+1))X1++Xk+1k+1)=P(X(k+1)log(k+1)x+(x+log(k+1))Tk+1),

di mana . Variabel ini menghilang dalam probabilitas karena dan . Secara asimptotik, distribusinya sama dengan . Karena adalah IID, kami punyaTk+1=X1+...+Xk+1k+1-1E(Tk+1)=0VSebuahr(log(k+1)Tk+1)=(log(k+1))2k+10X(k+1)-log(k+1)Xsaya

P(X(k+1)log(k+1)x)=P(X1x+log(k+1))k+1=(1exlog(k+1))k+1=(1exk+1)k+1exp{ex}.

5. Tinjauan grafis

Plot di bawah ini menunjukkan distribusi fragmen terbesar untuk nilai berbeda . Untuk , saya juga menimpakan distribusi Gumbel asimptotik (garis tipis). Gumbel adalah perkiraan yang sangat buruk untuk nilai-nilai kecil jadi saya menghilangkannya untuk tidak membebani gambar. Perkiraan Gumbel baik dari .kk=10,20,50kk50

Distribusi fragmen terbesar dari tongkat yang patah

6. Referensi

Bukti di atas diambil dari referensi 2 dan 3. Literatur yang dikutip memuat lebih banyak hasil, seperti distribusi ruang yang dipesan dari peringkat apa pun, distribusi batasnya dan beberapa konstruksi alternatif dari jarak seragam yang dipesan. Referensi utama tidak mudah diakses, jadi saya juga menyediakan tautan ke teks lengkap.

  1. Bairamov et al. (2010) Batasi hasil untuk penempatan seragam yang teratur , makalah Stat, 51: 1, hal 227-240
  2. Holst (1980) Pada panjang potongan-potongan tongkat patah secara acak , J. Appl. Prob., 17, hlm 623-634
  3. Pyke (1965) Spasi , JRSS (B) 27: 3, hlm. 395-449
  4. Renyi (1953) Tentang teori statistik pesanan , Acta math Hung, 4, hlm 191-231
gui11aume
sumber
Cemerlang. Ngomong-ngomong, apakah ada asimptotik yang diketahui untuk ? E(Zk2)
Amir Sagiv
@AmirSagiv ini pertanyaan yang bagus. Saya telah melihat sekilas referensi dan saya tidak dapat menemukannya. Saya juga tidak bisa mengadaptasi bukti di atas. Ini membuat saya sadar bahwa saya tidak tahu apa sebaran persegi Gumbel itu. Mungkin tempat yang bagus untuk memulai?
gui11aume
1
$ gui11aume Lihat di sini: mathoverflow.net/a/293381/42864
Amir Sagiv
1
@AmirSagiv Ini adalah posting yang sangat bagus. Untuk beberapa alasan, saya salah mengerti pertanyaan Anda dan berpikir Anda tertarik pada distribusi asimtotik (walaupun komentar Anda sangat jelas), jadi komentar saya di atas tidak begitu relevan. Zk2
gui11aume
3

Ini bukan jawaban yang lengkap, tetapi saya melakukan beberapa simulasi cepat, dan inilah yang saya peroleh: Histogram dari fragmen terpanjang

Ini terlihat sangat beta, dan ini masuk akal, karena statistik urutan distribusi seragam iid adalah beta wiki .

Ini mungkin memberikan beberapa titik awal untuk mendapatkan pdf yang dihasilkan.

Saya akan memperbarui jika saya mendapatkan solusi tertutup akhir.

Tepuk tangan!

lima
sumber
Hanya satu hal lagi, bentuk histogram untuk meningkatkan k tidak banyak berubah, selain menjadi "terjepit" mendekati 0.
Lima
1
Terima kasih atas pemikiran Anda @Lima (dan selamat datang di Cross Validated). Saya pikir jawaban Anda dapat ditingkatkan. Pertama, saya akan menahan diri untuk tidak membuat pernyataan tanpa bukti. Jika ini salah, Anda dapat menempatkan orang yang melihat utas ini di jalur yang salah. Kedua, saya akan mendokumentasikan apa yang Anda lakukan. Tanpa nilai yang Anda gunakan atau kode, angka tersebut tidak membantu siapa pun. Akhirnya, saya akan menyalin-mengedit jawaban dan menghapus semua yang tidak langsung menjawab pertanyaan. k
gui11aume
1
Terima kasih atas sarannya. Mereka valid di luar pertukaran stack, dan saya akan ingat untuk menggunakannya.
Lima
1

Saya menghasilkan jawaban untuk sebuah konferensi di Siena (Italia) pada tahun 2005. Makalah (2006) disajikan di situs web saya di sini (pdf) . Distribusi tepat dari semua jarak (terkecil ke terbesar) dapat ditemukan di halaman 75 & 76.

Saya berharap dapat memberikan presentasi tentang topik ini di Konferensi RSS di Manchester (Inggris) pada bulan September 2016.

CJStephens
sumber
2
Selamat datang di situs ini. Kami mencoba membangun repositori permanen untuk informasi statistik berkualitas tinggi dalam bentuk pertanyaan & jawaban. Jadi, kami waspada terhadap jawaban tautan saja, karena tautannya. Bisakah Anda memposting kutipan lengkap & ringkasan informasi di tautan, kalau-kalau mati? Juga, tolong jangan menandatangani posting Anda di sini. Setiap posting memiliki tautan ke halaman pengguna Anda di mana Anda dapat memposting informasi itu.
gung - Reinstate Monica