Setelah burn-in, bisakah kita langsung menggunakan iterasi MCMC untuk estimasi kepadatan, seperti dengan memplot histogram, atau estimasi kepadatan kernel? Kekhawatiran saya adalah bahwa iterasi MCMC belum tentu independen, meskipun paling banyak didistribusikan secara identik.
Bagaimana jika kita menerapkan penjarangan lebih lanjut pada iterasi MCMC? Kekhawatiran saya adalah bahwa iterasi MCMC paling tidak berkorelasi, dan belum independen.
Dasar yang saya pelajari untuk menggunakan fungsi distribusi empiris sebagai estimasi fungsi distribusi sebenarnya didasarkan pada teorema Glivenko-Cantelli , di mana fungsi distribusi empiris dihitung berdasarkan pada sampel iid. Saya sepertinya melihat beberapa alasan (hasil asimptotik?) Untuk menggunakan histogram, atau estimasi kepadatan kernel sebagai estimasi kepadatan, tetapi saya tidak dapat mengingatnya.
Lanjut
Anda dapat langsung menggunakan iterasi MCMC untuk apa pun karena nilai rata-rata yang Anda amati akan mendekati nilai sebenarnya (karena Anda setelah burn-in).
Namun, ingatlah bahwa varians rata-rata ini dipengaruhi oleh korelasi antara sampel. Ini berarti bahwa jika sampel berkorelasi, seperti yang umum di MCMC, menyimpan setiap pengukuran tidak akan membawa keuntungan nyata.
Secara teori, Anda harus mengukur setelah N langkah, di mana N adalah urutan waktu autokorelasi dari yang dapat Anda ukur.
Penjelasan detail
itulah yang ingin Anda dapatkan.
Jadi, untuk rekap:
Jika secara komputasi tidak memerlukan biaya apa pun untuk menyimpan setiap ukuran, Anda dapat melakukannya, tetapi ingatlah bahwa varians tidak dapat dihitung menggunakan rumus yang biasa.
sumber