Dalam masalah klasik Kupon Kolektor , diketahui bahwa waktu diperlukan untuk menyelesaikan satu set kupon yang dipilih secara acak memenuhi , , dan .
Batas atas ini lebih baik daripada yang diberikan oleh ketidaksetaraan Chebyshev, yang kira-kira .
Pertanyaan saya adalah: apakah ada yang sesuai yang lebih baik dari Chebyshev batas bawah untuk ? (mis. sesuatu seperti )?
Jawaban:
Saya memberikan ini sebagai jawaban kedua karena analisisnya benar-benar dasar dan memberikan hasil yang diinginkan.
Proposisi Untukc > 0 dan n ≥ 1 ,
Gagasan di balik buktinya sederhana:
Bukti
Untuk dan sembarang , kita memiliki itu s > 0 P ( T < t ) = P ( e - s T > e - s t ) ≤ e s t e e - s Tt s > 0
Karena dan independen, kita dapat menulis T i E e - s T = n ∏ i = 1 E e - s T iT= ∑sayaTsaya Tsaya
Sekarang karena adalah geometris, katakanlah dengan probabilitas keberhasilan , maka perhitungan sederhana menunjukkan p i E e - s T i = p iTsaya halsaya
The untuk masalah kita adalah , , , dll Oleh karena itu, p 1 = 1 p 2 = 1 - 1 / n p 3 = 1 - 2 / n n ∏ i = 1 E e - s T i = n ∏ i = 1 i / nhalsaya hal1= 1 hal2= 1 - 1 / n hal3= 1 - 2 / n
Mari kita pilih dan untuk beberapa . Kemudian dan , menghasilkan t = n log n - c n c > 0 e s t = n e - c e s = e 1 / n ≥ 1 + 1 / n n ∏ i = 1 i / ns = 1 / n t = n logn - c n c > 0
Menyatukan ini, kita mendapatkan
seperti yang diinginkan.
sumber
Meskipun @ cardinal telah memberikan jawaban yang memberikan batasan tepat yang saya cari, saya telah menemukan argumen gaya Chernoff yang serupa yang dapat memberikan batasan yang lebih kuat:
Proposisi : (ini lebih kuat untuk )c > π 2
Bukti :
Seperti dalam jawaban @ cardinal, kita dapat menggunakan fakta bahwa adalah jumlah variabel acak geometris independen dengan probabilitas keberhasilan . Oleh karena itu, dan .T i p i = 1 - i / n E [ T i ] = 1 / p i E [ T ] = ∑ n i = 1 E [ T i ] = n ∑ n i = 1 1T Tsaya halsaya= 1 - i / n E[ Tsaya] = 1 / psaya E[ T] = ∑ni = 1E[ Tsaya] = N Σni = 11saya≥ n logn
Tentukan sekarang variabel baru , dan . Kita kemudian dapat menulis S : = ∑ i S i Pr ( T ≤ n log n - c n ) ≤ Pr ( T ≤ E [ T ] - c n ) = Pr ( S ≤ - c n ) = Pr ( exp ( - s SSsaya: = Tsaya- E[ Tsaya] S: = ¢sayaSsaya
Menghitung rata-rata, yang kita miliki
es-1≥sez
Jadi, karena , kita dapat menulis Pr(T≤nlogn-cn)≤ e 1∑sayahal- 2saya= n2∑n - 1i = 11saya2≤ n2π2/ 6
Meminimalkan lebih dari , kami akhirnya memperolehs > 0
sumber
Catatan Penting : Saya telah memutuskan untuk menghapus bukti yang saya berikan pada awalnya di jawaban ini. Itu lebih lama, lebih komputasional, menggunakan palu yang lebih besar, dan membuktikan hasil yang lebih lemah dibandingkan dengan bukti lain yang saya berikan. Di sekitar, pendekatan yang lebih rendah (dalam pandangan saya). Jika Anda benar - benar tertarik, saya kira Anda dapat melihat hasil edit.
Hasil asimptotik yang saya kutip semula dan yang masih ditemukan di bawah dalam jawaban ini menunjukkan bahwa sebagai kita dapat melakukan sedikit lebih baik daripada yang dibuktikan dalam jawaban lain, yang berlaku untuk semua .n → ∞ n
Hasil asimptotik berikut ini berlaku
dan
Konstanta dan batasannya diambil sebagai . Perhatikan bahwa, meskipun dipisahkan menjadi dua hasil, hasilnya hampir sama karena tidak dibatasi menjadi tidak negatif dalam kedua kasus.c ∈ R n → ∞ c
Lihat, misalnya, Motwani dan Raghavan, Randomized Algorithms , hal. 60--63 untuk bukti.
Juga : David dengan ramah memberikan bukti untuk batas atas yang dinyatakan dalam komentar untuk jawaban ini.
sumber
Benjamin Doerr memberikan (dalam bab "Menganalisis Heuristik Pencarian Acak: Alat dari Teori Probabilitas" dalam buku "Teori Heuristik Pencarian Acak", lihat tautan untuk PDF online) bukti yang agak sederhana dari
Proposisi Biarkan menjadi waktu berhenti dari proses pengumpulan kupon. Kemudian .T Pr [ T≤ ( 1 - ϵ ) ( n - 1 ) lnn ] ≤ e- nϵ
Ini tampaknya memberikan asimptotik yang diinginkan (dari jawaban kedua @ cardinal), tetapi dengan keuntungan berlaku untuk semua dan .n ϵ
Ini sketsa bukti.
Sketsa Bukti: Misalkan adalah peristiwa di mana kupon ke- dikumpulkan di undian pertama . Dengan demikian, . Fakta kuncinya adalah bahwa berkorelasi negatif, untuk setiap , . Secara intuitif, ini cukup jelas, karena mengetahui bahwa kupon -th di pertama menarik akan membuat kecil kemungkinan bahwa kupon -th juga ditarik dalam pertama menarik.Xsaya saya t Pr [ Xsaya= 1 ] = ( 1 - 1 / n )t Xsaya saya⊆ [ n ] Pr [ ∀ i ∈ I, Xsaya= 1 ] ≤ ∏i ∈ IPr [ Xsaya= 1 ] saya t j t
Satu dapat membuktikan klaim, tetapi memperbesar set dengan 1 pada setiap langkah. Kemudian mengurangi untuk menunjukkan bahwa , untuk . Secara ekuivalen, dengan rata-rata, itu mengurangi untuk menunjukkan bahwa . Doerr hanya memberikan argumen intuitif untuk ini. Satu jalan ke bukti adalah sebagai berikut. Orang dapat mengamati bahwa dikondisikan pada kupon datang setelah semua kupon di , bahwa probabilitas menggambar kupon baru dari setelah menggambar sejauh ini sekarang , bukannya sebelumnyasaya Pr [ ∀ i ∈ I, Xsaya= 1 | Xj= 1 ] ≤ Pr [ ∀ i ∈ I, Xsaya= 1 ] j ∉ I j I I k | Saya | - kPr [ ∀ i ∈ I, Xsaya= 1 | Xj= 0 ] ≥ Pr [ ∀ i ∈ I, Xsaya= 1 ] j saya saya k | Saya| -k| saya| -kn - 1 jI| saya| -kn . Jadi mendekomposisi waktu untuk mengumpulkan semua kupon sebagai jumlah variabel acak geometrik, kita dapat melihat bahwa pengkondisian pada -coupon datang setelah meningkatkan probabilitas keberhasilan, dan dengan demikian pengkondisian hanya membuatnya lebih mungkin untuk mengumpulkan kupon sebelumnya ( oleh dominasi stokastik: setiap variabel acak geometris meningkat, dalam hal dominasi stokastik, oleh pengkondisian, dan dominasi ini kemudian dapat diterapkan ke jumlah).j saya
Dengan korelasi negatif ini, berarti , yang memberikan diinginkan terikat dengan . t = ( 1 - ϵ ) ( n - 1 ) ln nPr [ T≤ ( 1 - ϵ ) ( n - 1 ) lnn ] ≤ ( 1 - ( 1 - 1 / n )t)n t = ( 1 - ϵ ) ( n - 1 ) lnn
sumber