Bagaimana sampel dari distribusi diskrit pada bilangan bulat non-negatif?

10

Saya memiliki distribusi diskrit berikut, di mana konstanta dikenal:α,β

p(x;α,β)=Beta(α+1,β+x)Beta(α,β)for x=0,1,2,

Apa saja pendekatan untuk sampel secara efisien dari distribusi ini?

jII
sumber

Jawaban:

9

Ini adalah distribusi binomial Beta negatif , dengan parameter dalam kasus Anda, menggunakan notasi Wikipedia. Itu juga bernama distribusi Beta-Pascal ketika adalah bilangan bulat. Seperti yang Anda catat dalam komentar, ini adalah distribusi prediktif dalam model binomial negatif Bayesian dengan Beta konjugat sebelum probabilitas keberhasilan.r=1r

Dengan demikian Anda dapat mencicipi dengan sampling variabel dan kemudian sampling variabel binomial negatif (dengan dalam kasus Anda, yaitu untuk mengatakan distribusi geometris).u NB ( r , u ) r = 1Beta(α,β)uNB(r,u)r=1

Distribusi ini diimplementasikan dalam paket R brr. Sampler memiliki nama rbeta_nbinom, PMF memiliki nama dbeta_nbinom, dll. Notasi adalah , , . Memeriksa:c = α d = βa=rc=αd=β

> Alpha <- 2; Beta <- 3
> a <- 1
> all.equal(brr::dbeta_nbinom(0:10, a, Alpha, Beta), beta(Alpha+a, Beta+0:10)/beta(Alpha,Beta))
[1] TRUE

Melihat kode tersebut, orang dapat melihatnya benar-benar memanggil keluarga ghyper(generalisasi hypergeometrik) dari distribusi SuppDistspaket:

brr::rbeta_nbinom
function(n, a, c, d){
  rghyper(n, -d, -a, c-1)
}

Memang, distribusi BNB dikenal sebagai distribusi hipergeometrik umum tipe IV . Lihat bantuan ghyperdalam SuppDistspaket. Saya percaya ini juga dapat ditemukan dalam buku Johnson & al's Univariate Discrete Distribution .

Stéphane Laurent
sumber
Jawaban ini bagus, tetapi akan lebih baik jika Anda membuktikan bahwa kepadatan OP yang dipasang sama dengan kepadatan binomial negatif.
Sycorax mengatakan Reinstate Monica
1
@ user777 Saya pikir penulis OP membuktikannya sendiri, mengingat komentarnya terhadap jawaban Xian (distribusi prediksi posterior dalam model binomial negatif dengan Beta konjugat sebelumnya).
Stéphane Laurent
10

Mengingat bahwa berkurang dengan , saya sarankan untuk menghasilkan varian yang seragam dan menghitung jumlah terakumulasi hingga Realisasinya kemudian sama dengan . Sejak xuU(0,1)Sk=k x=0Beta(α+1,β+x)

Beta(α+1,β+x)Beta(α,β)=αα+β+xβ+x1α+β+x1βα+β
xuU(0,1) Sk>uk R x = Beta ( α + 1 , β + x )
Sk=x=0kBeta(α+1,β+x)Beta(α,β)
Sk>u
k
Rx=Beta(α+1,β+x)Beta(α,β)=αα+β+xβ+x1α+β+x1βα+β=α+β+x1α+β+xβ+x1α+β+x1Rx1=β+x1α+β+xRx1
dan perhitungan dapat menghindari penggunaan fungsi Gamma sama sekali.
Sk=Sk-1+Rk
Xi'an
sumber
1
(+1) Menggunakan akan sangat mempercepat pekerjaan. Sk=1-Γ(Sebuah+b)Γ(b+k+1)Γ(b)Γ(Sebuah+b+k+1)
whuber
1
Sunting: Saya menduga mengeksploitasi fungsi Gamma akan sangat membantu dalam menyelesaikan untuk dalam hal , , dan . Sebagai contoh, seseorang dapat menemukan perkiraan awal untuk dengan menggunakan Stirling's Formula dalam evaluasi dan dan kemudian memolesnya dengan beberapa Newton-Raphson Langkah. Mereka membutuhkan evaluasi log Gamma dan turunannya. Tentu saja jika dan keduanya tidak terpisahkan maka solusinya adalah akar dari sebuah polinomial - tetapi itupun dengan menggunakan Gamma mungkin masih merupakan jalan yang harus ditempuh. u α β u Γ ( b + k + 1 ) Γ ( a + b + k + 1 ) α βkkamuαβkamuΓ(b+k+1)Γ(Sebuah+b+k+1)αβ
whuber
1
Jawaban bagus! Saya menerima jawaban yang diberikan oleh SL karena itu membawa saya pada poin kunci (bukan bagian dari pertanyaan awal), bahwa pengambilan sampel dari prediksi posterior setara dengan pengambilan sampel parameter dari posterior, kemudian pengambilan sampel data dari kemungkinan. Secara khusus, fungsi distribusi di atas adalah prediksi posterior dari data Geometrik dengan Beta sebelum parameter . hal
jII