Tentu. Ini pada dasarnya adalah pengamatan bahwa distribusi Dirichlet adalah konjugat sebelum distribusi multinomial. Ini berarti mereka memiliki bentuk fungsional yang sama. Artikel itu menyebutkannya, tetapi saya hanya akan menekankan bahwa ini mengikuti dari model pengambilan sampel multinomial. Jadi, turun ke sana ...
Pengamatan tentang posterior, jadi mari kita perkenalkan beberapa data, , yang merupakan jumlah item berbeda. Kami mengamati total sampel. Kita asumsikan diambil dari distribusi yang tidak diketahui (di mana kita akan meletakkan sebelum -simplex).xKN=∑Ki=1xixπDir(α)K
Probabilitas posterior dari diberikan dan data adalahπαx
p(π|x,α)=p(x|π)p(π|α)
Kemungkinannya, , adalah distribusi multinomial. Sekarang mari kita menulis pdf:p(x|π)
p(x|π)=N!x1!⋯xk!πx11⋯πxkk
dan
p(π|α)=1B(α)∏i=1Kπα−1i
di mana . Mengalikan, kami menemukan bahwa,B(α)=Γ(α)KΓ(Kα)
p(π|α,x)=p(x|π)p(π|α)∝∏i=1Kπxi+α−1i.
Dengan kata lain, posterior juga Dirichlet. Pertanyaannya adalah tentang mean posterior. Karena posterior adalah Dirichlet, kita dapat menerapkan rumus untuk rata-rata Dirichlet untuk menemukan itu,
E[πi|α,x]=xi+αN+Kα.
Semoga ini membantu!
Sebagai catatan tambahan, saya juga ingin menambahkan poin lain pada derivasi di atas, yang sebenarnya tidak menyangkut pertanyaan utama. Akan tetapi, berbicara tentang dirichlet tentang distribusi multinomial, saya pikir layak untuk menyebutkan bahwa apa yang akan menjadi bentuk fungsi kemungkinan jika kita akan mengambil probabilitas sebagai variabel gangguan.
Seperti yang ditunjukkan dengan benar oleh sydeulissie, sebanding dengan . Sekarang di sini saya ingin menghitung .p(π|α,x) ∏Ki=1πxi+α−1i p(x|α)
Menggunakan identitas integral untuk fungsi gamma, kami memiliki:
Derivasi di atas dari kemungkinan untuk data kategori mengusulkan cara yang lebih kuat untuk menangani data ini untuk kasus-kasus yang ukuran sampel tidak cukup besar.N
sumber