Bayesian menyimpulkan sejumlah variabel acak bernilai nyata

8

Misalkan , , ..., menjadi iid RV dengan rentang tetapi distribusinya tidak diketahui. (Saya setuju dengan anggapan bahwa distribusi ini kontinu, dll., Jika perlu.)X1X2Xn[0,1]

Tentukan .Sn=X1++Xn

Saya diberikan , dan bertanya: Apa yang bisa saya simpulkan, dengan cara Bayesian, tentang ?SkSn

Yaitu, saya diberikan jumlah sampel ukuran RV, dan saya ingin tahu apa yang dapat saya simpulkan tentang distribusi jumlah semua RV, menggunakan pendekatan Bayesian (dan mengasumsikan prioritas yang masuk akal tentang distribusi).k

Jika dukungannya adalah alih-alih , maka masalah ini dipelajari dengan baik, dan (dengan prior pri seragam) Anda mendapatkan distribusi senyawa beta-binomial untuk distribusi yang disimpulkan pada . Tapi saya tidak yakin bagaimana cara mendekatinya dengan karena jangkauan ...{0,1}[0,1]Sn[0,1]

Pengungkapan penuh : Saya sudah memposting ini di MathOverflow , tetapi diberitahu bahwa akan lebih baik diposting di sini, jadi ini adalah posting ulang.

Ronald L Rivest
sumber
Saya baru saja akan menulis komentar kepada Anda di MO, tetapi saya akan menulisnya di sini. Jika Anda merasa pertanyaannya lebih cocok untuk forum ini, Anda mungkin menandainya di MO dan meminta untuk menutupnya.
kardinal
1
Saya ingin klarifikasi pernyataan terakhir Anda. Jika rentangnya adalah maka distribusi apa pun yang menempatkan massa pada nilai tidak dalam untuk distribusi tampaknya konyol, jadi saya ingin tahu apakah saya ' Saya sudah mengerti tujuan Anda dengan benar. (Mungkin referensi akan sangat membantu.){0,1}{0,1,,n}Sk
kardinal
Apa yang saya salah pahami?
kardinal
1
Apakah Anda tertarik dengan Bayesian non-parametrics? Jika Anda tidak ingin membuat asumsi tentang distribusi , Anda memerlukan kerangka kerja non-parametrik. Tapi kemudian, hanya diberikan Anda tidak bisa bicara banyak ...XkSk
Xi'an
1
Ini adalah komentar yang bagus; maaf masalahnya sedikit kacau. Saya berpikir bahwa n sangat besar dibandingkan dengan , dan posterior pada akan langsung mencerminkan posterior pada parameter. Mungkin alih-alih saya seharusnya menggunakan , dan meminta posterior di ketika menuju ke infinity. Apakah ini masuk akal sekarang? kSnSnSn=Sn/nlimSnn
Ronald L Rivest

Jawaban:

2

Pertimbangkan analisis nonparametrik Bayesian berikut.

Tentukan dan biarkan menjadi himpunan bagian Borel dari . Biarkan menjadi ukuran terbatas bukan nol .X=[0,1]BXα(X,B)

Biarkan menjadi proses Dirichlet dengan parameter , dan misalkan bersyarat iid, mengingat bahwa , sehingga , untuk setiap .QαX1,,XnQ=qμX1(B)=P{X1B}=q(B)BB

Dari sifat-sifat proses Dirichlet, kita tahu bahwa, mengingat , distribusi prediksi pengamatan masa depan seperti adalah ukuran over didefinisikan oleh X1,,XkXk+1β(X,B)

β(B)=1α(X)+k(α(B)+i=1kIB(Xi)).

Sekarang, tentukan sebagai bidang sigma yang dihasilkan oleh , dan gunakan keterukur dan simetri untuk mendapatkan hampir pasti.FkX1,,XkXi

E[SnFk]=Sk+E[i=k+1nXi|Fk]=Sk+(nk)E[Xk+1Fk],

Untuk menemukan jawaban eksplisit, anggap bahwa adalah . Mendefinisikan , kita memiliki hampir pasti (distribusi gabungan ), di mana . Dalam batas "noninformatif" dari , ekspektasi sebelumnya berkurang menjadi , yang berarti, dalam hal ini, perkiraan posterior Anda untuk hanya kali rata-rata dari pertamaα()/α(X)U[0,1]c=α(X)>0

E[SnX1=x1,,Xk=xk]=sk+nkc+k(c2+sk),
[μX1,,Xk]X1,,Xksk=x1++xkc0n(sk/k)Snnk pengamatan, yang terlihat seintuitif mungkin.
Zen
sumber
Apakah mungkin untuk mendapatkan ekspresi yang bagus untuk bawah model ini juga? Var[Sn|Sk]
Cyan
1

Maafkan kurangnya teori ukuran dan penyalahgunaan notasi di bawah ini ...

Karena ini adalah inferensi Bayesian, harus ada beberapa yang sebelumnya tidak diketahui dalam masalah, yang dalam hal ini adalah distribusi , parameter dimensi tak terbatas mengambil nilai dalam set distribusi pada (sebut saja ). Distribusi data konvergen ke distribusi normal, jadi jika cukup besar ( teorema Berry-Esseen ) kita bisa menampar normal itu sebagai perkiraan. Lebih jauh, jika perkiraannya akurat, satu-satunya aspek dari prioritas sebelumnyaX1[0,1]πSk|πkp(π) yang penting secara praktis adalah induksi sebelumnya (Eπ(X1),Varπ(X1))=(μ,σ2).

Sekarang kita melakukan prediksi Bayesian standar dan memasukkan perkiraan kepadatan. (Sn tunduk pada perkiraan yang sama dengan Sk.)

p(Sn|Sk)=p(π|Sk)p(Sn|π,Sk)dπ

p(Sn|Sk)=p(π)p(Sk|π)p(Sk)p(Sn|π,Sk)dπ

p(Sn|Sk)p(μ,σ2)N(Sk|kμ,kσ2)N(Sn|(nk)μ+Sk,(nk)σ2)d(μ,σ2)p(μ,σ2)N(Sk|kμ,kσ2)d(μ,σ2)

Untuk batas integral, μ[0,1], jelas; kupikirσ2[0,14]?

Ditambahkan nanti: tidak, σ2[0,μ(1μ)]. Ini bagus - nilai yang diizinkan dari σ2 bergantung pada μ, jadi info dalam data tentang μ relevan dengan σ2 terlalu.

Cyan
sumber
1
Saya tidak mengerti paragraf utama Anda. Pertama-tama, konvergensi ke normal hanya setelah pergeseran dan skalaSndan ini bukan oleh teorema Berry - Esseen (yang merupakan teorema pada tingkat konvergensi menjadi normal), tetapi CLT. Lebih jauh, pergeseran dan skala akan tergantung pada parameter tetap tertentu. Pernahkah Anda melihat sebuah kasus di mana Anda memiliki, katakanlah, tiga poin sebelum didistribusikan secara seragam{0,1/2,1}?
kardinal
Biarkan saya mengklarifikasi bahwa ketika saya menulis "normal" saya tidak bermaksud standar normal. Jadi pergeseran dan skala ulang mengubah mean dan varians tetapi konvergensi masih beberapa elemen dalam keluarga distribusi normal. Saya bermaksud untuk tautan ke teorema Berry-Esseen untuk merujuk frasa "jikakcukup besar "; penempatannya saat ini adalah kesalahan cut-n-paste, dan saya akan mengubahnya. Saya tidak mengerti pertanyaan Anda tentang parameter tetap - dapatkah Anda mengklarifikasi pertanyaan?
Cyan
Re: pertanyaan kardinal. Perhatikan bahwa prior adalah distribusi pada distribusi dengan dukungan di[0,1]. Jika saya menerima pertanyaan Anda secara harfiah, Anda bertanya tentang prior yang memiliki dukungan pada tiga variabel acak konstan , yang sepele untuk dianalisis. Tetapi karena Anda menulis di komentar lain "Jika kisarannya adalah0,1 lalu distribusi apa pun yang menempatkan massa pada nilai tidak 0,1,,n untuk distribusi Sktampaknya konyol, "Saya pikir Anda meminta distribusi data diskrit. Jawaban singkatnya adalah," tidak, itu tidak konyol. "Lanjutan ...
Cyan
Saya pikir ada beberapa masalah di sini: (a) Pernyataan pertanyaan dapat menggunakan beberapa penyempurnaan untuk mengklarifikasi tujuan akhir, (b) pertanyaan, komentar dan jawaban, sayangnya, telah dikacaukan melalui kesalahan ketik yang tidak disengaja, kesalahan perhitungan dan banyak utas percakapan. , dan (c) komentar saya yang dirujuk di atas tampak sedikit keluar dari konteks. Pernyataan saya tentangSk (Typo: seharusnya Snberkaitan dengan distribusi posteriorSn diberikan Sk. Jika saya tahuSn{Sk,,n}maka setiap distribusi posterior yang tidak menempatkan semua massanya harus tidak dapat diterima.
kardinal
0

Biarkan masing-masing Xi milik keluarga distribusi F dan memiliki parameter θ.

Diberikan, Sk, kami memiliki distribusi di θ:

Pr(θSk)=1ZPr(θ)Pr(Skθ)

Dan, distribusi kami di Sn, nk adalah

Pr(Sn=iSk)=Pr(Snk=iSk|Sk)=Pr(Snk=iSk|θ)Pr(θSk)dθ

(dan juga untuk n<k)

Kedua persamaan ini memiliki bentuk yang bagus ketika Fadalah distribusi dalam keluarga eksponensial yang ditutup dengan penjumlahan elemen iid seperti distribusi normal, distribusi gamma, dan distribusi binomial. Ini juga berfungsi untuk kasus khusus mereka seperti distribusi eksponensial dan distribusi Bernoulli.

Mungkin menarik untuk dipertimbangkan F adalah keluarga yang diskalakan (oleh 1n) distribusi binomial dengan "percobaan" yang dikenal n, dan mengambil batas sebagai n pergi hingga tak terbatas.

Neil G
sumber