Longsoran menyukai proses stokastik

16

Pertimbangkan proses berikut:

Ada n nampan yang disusun dari atas ke bawah. Awalnya, setiap nampan berisi satu bola. Di setiap langkah, kita

  1. pilih bola b secara acak dan seragam
  2. pindahkan semua bola dari tempat sampah yang berisi b ke nampan di bawahnya. Jika sudah menjadi nampan terendah, kami menghapus bola dari proses.

Berapa banyak langkah yang dibutuhkan dalam ekspektasi sampai proses berakhir, yaitu, sampai semua n bola telah dihapus dari proses? Apakah ini sudah dipelajari sebelumnya? Apakah jawabannya mengikuti dengan mudah dari teknik yang dikenal?

Dalam kasus terbaik, proses dapat selesai setelah n langkah. Dalam kasus terburuk dapat mengambil langkah Θ(n2) . Kedua kasus seharusnya sangat tidak mungkin. Dugaan saya adalah bahwa ia membutuhkan langkah Θ(nlogn) dan saya melakukan beberapa percobaan yang sepertinya mengkonfirmasi hal ini.

(Perhatikan bahwa memilih nampan secara seragam secara acak adalah proses yang sangat berbeda yang jelas akan mengambil Θ(n2) langkah untuk menyelesaikannya.)

Matthias
sumber
Pertanyaannya terlihat menarik (walaupun saya tidak tahu jawabannya). Tampaknya sulit karena tidak monoton; jika semua n bola berada di nampan atas, prosesnya jelas berakhir dengan tepat n langkah.
Tsuyoshi Ito

Jawaban:

11

Bukan benar-benar jawaban, tetapi komentar panjang tentang jawaban András.

Jawaban András berisi intuisi yang bagus, meskipun saya tidak percaya ini adalah perhitungan ketat dari jumlah langkah yang diharapkan. Saya pikir ini mungkin perkiraan yang baik untuk sebuah jawaban, tetapi tampaknya tidak menangani kasus-kasus di mana nampan di bawah nampan terisi tertinggi menjadi kosong sebelum nampan atas dikosongkan ke bawah. Namun, ini mungkin perkiraan yang masuk akal untuk dibuat (saya tidak yakin).

Perhitungannya mengandung kesalahan yang mempengaruhi penskalaan. Saya akan mengambil titik awal yang sama persis, dan mengulang dan memperluas perhitungan.

Itu merindukan faktor p di dalam penjumlahan, karena probabilitas untuk secara acak memilih bin yang benar adalah daripada1haln . Hasilnya kami punya1n

n+hal=1nk=0(k+1)haln(n-haln)k=n+hal=1nhalnk=0(k+1)(n-haln)k=n+hal=1nhalnn2hal2=n+nhal=1n1/hal=n(1+Hn)

dengan adalah bilangan harmonik ke-n . Untuk memperkirakan H n, kita cukup mengganti penjumlahan dengan integral: H nn + 1 1 1Hn=hal=1n1/halHn. Jadi penskalaannya adalahn(1+log(n+1))atau sekitarnlog(n+1). Meskipun penskalaan ini tidak cocok dengan penskalaan masalah secara tepat (lihat simulasi di bawah), namun hampir sama dengan faktorlog(2).Hn1n+11xdx=log(n+1)n(1+log(n+1))nlog(n+1)log(2)

Simulation vs theory

Lingkaran merah: Poin data dari simulasi proses yang dirata-rata lebih dari 10k berjalan. Hijau: . Biru: n log ( n + 1 ) .nlog2(n+1)nlog(n+1)

Joe Fitzsimons
sumber
@ Joe: Kerja bagus! Akan menarik untuk sekarang menunjukkan ketat bagaimana faktor datang dari penciptaan kesenjangan. ln2
András Salamon
@ András: Saya benar-benar tidak memiliki perasaan yang baik untuk apakah ini merupakan perkiraan suara untuk membuat atau tidak. @ Peter gagasan tentang tandan membentuk yang bergeser ke bawah, sepertinya itu harus memberikan ekspresi yang benar dengan asumsi bahwa ini sama-sama kemungkinan terbentuk di bin.
Joe Fitzsimons
@ Jo: Bola paling atas akan tetap terisolasi di hampir 1/3 dari kasus. Pertimbangkan 3 bola teratas. Jika yang di tengah dipilih pertama (dari ke-3), ia akan bergabung dengan yang ketiga. Keduanya akan, sejak saat itu, bergerak dua kali lebih cepat dari bola atas. Jarak antara mereka dan bola atas adalah jalan acak yang sangat bias dan probabilitas bola atas untuk mengejar ketinggalan dibatasi oleh konstanta kecil (ish) (perkiraan kasar 15%). Tapi kabar baiknya adalah bahwa bola atas dan bola seharusnya tidak terlalu penting. Jika semuanya dihapus dalam langkah-langkah n \ log n, mereka hanya akan menambahkan langkah-langkah n \ log n tambahan.
Matthias
nlogn
@Matthias: Menganalisis waktu yang diperkirakan dengan asumsi intuisi Peter benar bukan merupakan road block (setidaknya dari sudut pandang saya). Bagi saya membuktikan bahwa intuisi ini sebenarnya merupakan refleksi yang adil tentang apa yang terjadi pertama-tama perlu, meskipun saya curiga itu adalah perkiraan yang baik.
Joe Fitzsimons
9

Sunting: Saya meninggalkan jawaban ini sebagaimana adanya (untuk saat ini) untuk menggambarkan proses berantakan dari pembuktian teorema, sesuatu yang ditinggalkan dari makalah yang diterbitkan. Intuisi inti di sini adalah cukup fokus pada bola atas, karena menyapu semua di bawahnya. Silakan lihat komentar (khususnya @Michael menunjukkan bahwa celah dapat terjadi) dan @ Joe nanti menjawab bagaimana kesalahan diidentifikasi dan diperbaiki. Saya terutama suka menggunakan eksperimen Joe untuk memeriksa ulang apakah formula itu masuk akal.


Batas bawah adalah n seperti yang Anda tunjukkan, tetapi agak mengejutkan tampaknya ada batas atas (1+π2/6)n untuk jumlah langkah yang diharapkan.

To derive this, note that a sequence of balls will clear all the bins precisely if it contains a subsequence b1b2bn such that b1=n, b2n1, , bini+1. Kondisi tambahan diperlukan pada urutan untuk menghindari bola yang dipilih yang tidak lagi ada dalam sistem, tetapi untuk tujuan batas atas, anggaplah bahwa ada urutan menurun yang tak terbatas dari tempat sampah (sehingga bola tidak hilang ketika meninggalkan tempat sampah). 1, tetapi dipindahkan ke bin 0, kemudian bin -1, dan seterusnya). Maka jumlah langkah yang diharapkan agar terlihat berikutnya adalah jumlah langkah yang diharapkan sebelumnyab1 terlihat, ditambah jumlah langkah yang diharapkan sebelumnya b2 terlihat, dan seterusnya (turun ke 1, sejak bn dapat berupa angka apa saja 1,2,...,n). Ini dapat dilihat sebagai peristiwa yang terpisah, satu demi satu. Jumlah langkah yang diharapkan saat itu

n+p=1nk=0k+1n(npn)k=n+p=1n11npk=1k(npn)k=n+p=1n11npn(np)/p2=n+np=1n11/p2(1+π2/6)n.

András Salamon
sumber
3
@Andras @Joe: Holy schmoley. If all the people asking the questions on this site took their questions as seriously as you take answering them, this would be the badassest url on the internet.
Aaron Sterling
1
@András: I'm trying to understand your statement "a sequence of balls will clear all the bins precisely if it contains a subsequence...". Maybe I've misunderstood something, but say we have four balls. If the sequence is 3,4,3,2,4 then it seems to satisfy your subsequence requirement, yet not all the bins have been cleared.
Michael
1
@András: If you want to show a reasonable upper bound, you have to use the fact that balls disappear from the process and are no longer picked. Otherwise, the top most ball is always only picked with probability 1/n and there is a good chance (maybe slightly less than 1/2) that this ball will stay isolated the whole time. For this ball, you will need n^2 steps.
Matthias
1
@Michael: I think you have identified the mistake. I'm assuming falsely that the top ball will move down even if there is a gap.
András Salamon
2
Here's my intuition. After a few steps, some clump of balls is going to be larger than any other clump of balls. At this point, the clump moves faster than everything else, clears everything below it and falls out of the system. This whole process should take O(n) or maybe O(nlogn) steps. This first clump is uniformly distributed in the line, so on average it takes half the balls with it. Now, we're left with a system of around n/2 balls, and another clump forms. So after around logn clumps, we're done.
Peter Shor