Saya telah melihat pertanyaan augmentasi data MCMC; bentuk umum dari pertanyaan adalah sebagai berikut:
Misalkan data yang dikumpulkan pada suatu proses menyarankan dan prior untuk parameter rate disarankan sebagai . Data dicatat dan disajikan dalam bentuk yang khas (yaitu jumlah kemunculan dari setiap nilai untuk dari hingga ), namun, data yang dikumpulkan tidak membeda-bedakan dalam kasus di mana (yaitu semua kejadian di mana dan dikelompokkan ke dalam satu kategori).
Mengingat data, kemungkinan dan yang dijelaskan sebelumnya di atas, pertanyaannya adalah:
Bentuk posterior ,
Jumlah kemunculan di mana .
Saya tidak begitu yakin bagaimana menjawab pertanyaan ini, tetapi saya sadar bahwa Gibbs Sampling dapat digunakan dalam augmentasi data. Adakah yang punya informasi tentang bagaimana ini bisa dilakukan?
EDIT:
Saya harus menentukan bahwa itu terutama bagian kedua (jumlah kejadian di mana ) yang saya tidak yakin. Untuk bagian pertama (bentuk posterior ), mengingat kemungkinan dan saran sebelumnya, saya beralasan (walaupun saya senang dikoreksi):
Diberikan:
Jadi, untuk model yang diberikan di atas:
Menyederhanakan hasil:
yang sebanding dengan (dan karenanya bentuk posterior diberikan oleh):
sumber