Misalkan , , ..., menjadi iid RV dengan rentang tetapi distribusinya tidak diketahui. (Saya setuju dengan anggapan bahwa distribusi ini kontinu, dll., Jika perlu.)
Tentukan .
Saya diberikan , dan bertanya: Apa yang bisa saya simpulkan, dengan cara Bayesian, tentang ?
Yaitu, saya diberikan jumlah sampel ukuran RV, dan saya ingin tahu apa yang dapat saya simpulkan tentang distribusi jumlah semua RV, menggunakan pendekatan Bayesian (dan mengasumsikan prioritas yang masuk akal tentang distribusi).
Jika dukungannya adalah alih-alih , maka masalah ini dipelajari dengan baik, dan (dengan prior pri seragam) Anda mendapatkan distribusi senyawa beta-binomial untuk distribusi yang disimpulkan pada . Tapi saya tidak yakin bagaimana cara mendekatinya dengan karena jangkauan ...
Pengungkapan penuh : Saya sudah memposting ini di MathOverflow , tetapi diberitahu bahwa akan lebih baik diposting di sini, jadi ini adalah posting ulang.
Jawaban:
Pertimbangkan analisis nonparametrik Bayesian berikut.
Tentukan dan biarkan menjadi himpunan bagian Borel dari . Biarkan menjadi ukuran terbatas bukan nol .X=[0,1] B X α (X,B)
Biarkan menjadi proses Dirichlet dengan parameter , dan misalkan bersyarat iid, mengingat bahwa , sehingga , untuk setiap .Q α X1,…,Xn Q=q μX1(B)=P{X1∈B}=q(B) B∈B
Dari sifat-sifat proses Dirichlet, kita tahu bahwa, mengingat , distribusi prediksi pengamatan masa depan seperti adalah ukuran over didefinisikan olehX1,…,Xk Xk+1 β (X,B)
Sekarang, tentukan sebagai bidang sigma yang dihasilkan oleh , dan gunakan keterukur dan simetri untuk mendapatkan hampir pasti.Fk X1,…,Xk Xi
Untuk menemukan jawaban eksplisit, anggap bahwa adalah . Mendefinisikan , kita memiliki hampir pasti (distribusi gabungan ), di mana . Dalam batas "noninformatif" dari , ekspektasi sebelumnya berkurang menjadi , yang berarti, dalam hal ini, perkiraan posterior Anda untuk hanya kali rata-rata dari pertamaα(⋅)/α(X) U[0,1] c=α(X)>0
sumber
Maafkan kurangnya teori ukuran dan penyalahgunaan notasi di bawah ini ...
Karena ini adalah inferensi Bayesian, harus ada beberapa yang sebelumnya tidak diketahui dalam masalah, yang dalam hal ini adalah distribusi , parameter dimensi tak terbatas mengambil nilai dalam set distribusi pada (sebut saja ). Distribusi data konvergen ke distribusi normal, jadi jika cukup besar ( teorema Berry-Esseen ) kita bisa menampar normal itu sebagai perkiraan. Lebih jauh, jika perkiraannya akurat, satu-satunya aspek dari prioritas sebelumnyaX1 [0,1] π Sk|π k p(π) yang penting secara praktis adalah induksi sebelumnya (Eπ(X1),Varπ(X1))=(μ,σ2) .
Sekarang kita melakukan prediksi Bayesian standar dan memasukkan perkiraan kepadatan. (Sn tunduk pada perkiraan yang sama dengan Sk .)
Untuk batas integral,μ∈[0,1] , jelas; kupikirσ2∈[0,14] ?
Ditambahkan nanti: tidak,σ2∈[0,μ(1−μ)]. Ini bagus - nilai yang diizinkan dari
σ2 bergantung pada μ , jadi info dalam data tentang μ relevan dengan σ2 terlalu.
sumber
Biarkan masing-masingXi milik keluarga distribusi F dan memiliki parameter θ .
Diberikan,Sk , kami memiliki distribusi di θ :
Dan, distribusi kami diSn , n≥k adalah
(dan juga untukn<k )
Kedua persamaan ini memiliki bentuk yang bagus ketikaF adalah distribusi dalam keluarga eksponensial yang ditutup dengan penjumlahan elemen iid seperti distribusi normal, distribusi gamma, dan distribusi binomial. Ini juga berfungsi untuk kasus khusus mereka seperti distribusi eksponensial dan distribusi Bernoulli.
Mungkin menarik untuk dipertimbangkanF adalah keluarga yang diskalakan (oleh 1n ) distribusi binomial dengan "percobaan" yang dikenal n , dan mengambil batas sebagai n pergi hingga tak terbatas.
sumber