Perkiraan sederhana distribusi kumulatif Poisson ekor panjang?

10

Saya ingin memutuskan kapasitas dari sebuah tabel sehingga memiliki peluang sisa kurang dari untuk melimpah karena , dengan asumsi jumlah entri mengikuti hukum Poisson dengan yang diberikan ekspektasi .2 - p p [ 40 120 ] E [ 10 3 ... 10 12 ]C2pp[40120]E[1031012]

Idealnya, saya ingin integer terendah Csehingga 1-CDF[PoissonDistribution[E],C] < 2^-pdiberikan pdan E; tapi saya puas dengan beberapa yang Csedikit lebih tinggi dari itu. Mathematica baik untuk perhitungan manual, tetapi saya ingin menghitung Cdari pdan Epada waktu kompilasi, yang membatasi saya ke aritmatika integer 64-bit.

Update: Di Mathematica (versi 7) e = 1000; p = 40; c = Quantile[PoissonDistribution[e], 1 - 2^-p]adalah 1231dan tampaknya tentang benar (terima kasih @Procrastinator); Namun hasil untuk kedua p = 50dan p = 60adalah 1250, yang salah di sisi aman (dan hal-hal: mengulangi percobaan saya seperti kali atau lebih, dan saya ingin terbukti kurang dari peluang keseluruhan kegagalan). Saya ingin beberapa perkiraan kasar tapi aman menggunakan aritmatika integer 64-bit saja , seperti yang tersedia di C (++) pada waktu kompilasi. 2 - 30225230

fgrieu
sumber
1
Bagaimana dengan C = Quantile[PoissonDistribution[E],1-2^p]?
1
Istilah terkemuka fungsi massa probabilitas Poisson mendominasi di bagian ekor.
kardinal
1
@Prastrastator: ya yang bekerja di Mathematica (kecuali untuk tanda p, dan masalah presisi, dan nama Edan Cyang dicadangkan). TETAPI saya membutuhkan perkiraan sederhana tentang hal itu, mungkin mentah (tetapi di sisi yang aman) menggunakan arityhmetic integer 64-bit saja!
fgrieu
3
Re the update: Mathematica 8 mengembalikan 1262 untuk dan 1290 untuk . Perkiraan Normal Kembali (@Proc): ini tidak dapat diharapkan bekerja dengan baik di bagian ekor, yang sangat penting untuk perhitungan. p = 60p=50p=60
Whuber
1
Mungkin Anda harus bertanya pada stackoverflow. Saya tidak terbiasa dengan kendala yang Anda miliki. Saya tidak tahu apa yang menghentikan Anda dari menggunakan alokasi memori dinamis, atau apakah Anda dapat menggunakan percabangan untuk menentukan ukuran array, atau berapa biaya untuk mendefinisikan array yang dua kali ukuran yang Anda butuhkan (dan kemudian tidak menggunakan semua itu). Jika beberapa fungsi seperti (seperti contoh) memberi Anda jawaban yang tepat, apakah Anda dapat menerapkan perkiraan di bawah kendala Anda atau tidak? Sepertinya masalah pemrograman sekarang. μ+loglogμlogμμ+pμlogμ
Douglas Zare

Jawaban:

10

Distribusi Poisson dengan rata-rata besar kira-kira normal, tetapi Anda harus berhati-hati bahwa Anda menginginkan ikatan ekor dan perkiraan normal secara proporsional kurang akurat di dekat ekor.

Salah satu pendekatan yang digunakan dalam pertanyaan MO ini dan dengan distribusi binomial adalah untuk mengenali bahwa ekor berkurang lebih cepat daripada deret geometri, sehingga Anda dapat menulis batas atas eksplisit sebagai deret geometri.

k=Dexp(μ)μkk!<k=Dexp(μ)μDD!(μD+1)kD=exp(μ)μDD!11μD+1<exp(μ)μD2πD(D/e)D11μD+1=exp(Dμ)(μD)DD+12πD(D+1μ)

Baris 2 baris 3 terkait dengan rumus Stirling. Dalam praktiknya saya pikir Anda kemudian ingin menyelesaikan numerik menggunakan pencarian biner. Metode Newton dimulai dengan tebakan awaljuga harus bekerja.- p log 2 = log ( terikat ) D = μ + c plog2=log(bound)D=μ+cμ.

Misalnya, dengan dan , solusi numerik yang saya dapatkan adalah 1384,89. Distribusi Poisson dengan rata-rata mengambil nilai dari hingga dengan probabilitasNilai hingga terjadi dengan probabilitasμ = 1000 1000 0 1384 1 - 1 / 2 100,06 . 0 1383 1 - 1 / 2 99,59 .p=100μ=100010000138411/2100.06.0138311/299.59.

Douglas Zare
sumber
1
+1. Pendekatan lain mengaitkan probabilitas ekor Poisson (di sebelah kanan) dengan probabilitas ekor dari distribusi Gamma (di sebelah kiri), yang dapat diperkirakan secara dekat (lebih) dengan perkiraan saddlepoint.
whuber
Ada jauh dari itu untuk sesuatu yang terbatas pada 64-bit integer aritmatika (tanpa exp, log, sqrt ..) tapi saya akan bekerja di sana; Terima kasih semuanya!
fgrieu
(+1) Sampai dengan permohonan perkiraan Stirling (yang tidak relevan), inilah tepatnya yang saya (secara samar) merujuk dalam komentar saya kepada OP. (Misalnya, lihat di sini .)
kardinal
2

Anda dapat melihat P. Harremoës: Batas Tajam pada Kemungkinan Ekor untuk Variabel Acak Poisson https://helda.helsinki.fi/bitstream/handle/10138/229679/witmse_proc_17.pdf Ketidaksamaan utama ada sebagai berikut. Biarkan menjadi variabel acak Poisson dengan parameter . Letakkan Biarkan menunjukkan fungsi distribusi kumulatif untuk hukum normal standar. Kemudian, untuk semua bilangan bulat , yang setara dengan untuk semua bilangan bulatYλ

G(x)=2(xlnxλ+λx)  sign(xλ).
Φk0
P(Y<k)Φ(G(k))P(Yk),
Φ(G(k1))P(Y<k)Φ(G(k))
k>0. Selain itu, yang menyiratkan bahwa untuk semua bilangan bulat .Φ(G(k+(1/2)))P(Yk)
Φ(G(k1/2))P(Y<k)Φ(G(k))
k>0

Pavel Ruzankin
sumber
Jika Anda bisa menuliskan persamaan kunci (dengan asumsi hanya ada satu atau dua) yang akan membantu jika tautan mati pada suatu waktu.
jbowman