Apa hubungan antara ukuran sampel dan pengaruh prior on posterior?

17

Jika kita memiliki ukuran sampel yang kecil, apakah distribusi sebelumnya akan banyak mempengaruhi distribusi posterior?

toby j
sumber
5
Intuisi jelas: semakin banyak data yang Anda miliki, semakin sedikit Anda harus bergantung pada prior Anda. Bukan hanya pelajaran statistik, tapi pelajaran hidup! ;)
Lucas Reis

Jawaban:

27

Iya. Distribusi posterior untuk parameter , diberikan set data X dapat ditulis sebagaiθX

p(θ|X)p(X|θ)likelihoodp(θ)prior

atau, seperti yang lebih umum ditampilkan pada skala log,

log(p(θ|X))=c+L(θ;X)+log(p(θ))

Log-likelihood, , berskala dengan ukuran sampel , karena merupakan fungsi dari data, sedangkan kepadatan sebelumnya tidak. Oleh karena itu, ketika ukuran sampel meningkat, nilai absolut L ( θ ; X ) semakin besar sementara log ( p ( θ ) ) tetap tetap (untuk nilai tetap θ ), dengan demikian jumlah L ( θ ; X )L(θ;X)=log(p(X|θ))L(θ;X)log(p(θ))θ menjadi lebih banyak dipengaruhi oleh L ( θ ; X ) ketika ukuran sampel meningkat.L(θ;X)+log(p(θ))L(θ;X)

Karena itu, untuk langsung menjawab pertanyaan Anda - distribusi sebelumnya menjadi kurang relevan karena menjadi lebih besar daripada kemungkinannya. Jadi, untuk ukuran sampel yang kecil, distribusi sebelumnya memainkan peran yang jauh lebih besar. Ini setuju dengan intuisi karena, Anda akan berharap bahwa spesifikasi sebelumnya akan memainkan peran yang lebih besar ketika tidak ada banyak data yang tersedia untuk membantahnya sedangkan, jika ukuran sampel sangat besar, sinyal yang ada dalam data akan lebih besar daripada apa pun yang ditentukan Keyakinan dimasukkan ke dalam model.

Makro
sumber
6
+1 Perhatikan bahwa juga tergantung pada n . cn
20

Berikut adalah upaya untuk mengilustrasikan paragraf terakhir dalam jawaban Makro (+1) yang unggul. Ini menunjukkan dua prior untuk parameter dalam distribusi B i n o m i a l ( n , p ) . Untuk beberapa n yang berbeda , distribusi posterior ditunjukkan ketika x = n / 2 telah diamati. Seperti n tumbuh, baik posteriors menjadi lebih dan lebih terkonsentrasi di sekitar 1 / 2 .pBinomial(n,p)nx=n/2n1/2

Untuk perbedaannya cukup besar, tetapi untuk n = 50 hampir tidak ada perbedaan.n=2n=50

Kedua prior bawah (hitam) dan B e t a ( 2 , 2 ) (merah). Posteriors memiliki warna yang sama dengan priors dari mana mereka berasal.Beta(1/2,1/2)Beta(2,2)

Distribusi posterior

(Perhatikan bahwa untuk banyak model lain dan prior lainnya, tidak akan cukup untuk yang sebelumnya tidak penting!)n=50

MånsT
sumber
4
Ilustrasi yang sangat keren, @ MånsT. Saya menghilangkan huruf miring kata 'Beta' dan 'Binomial' dalam jawaban Anda - Saya harap Anda tidak keberatan.
Makro
Tentu saja tidak, @ Macro! Saya setuju bahwa ini terlihat lebih baik dengan cara ini.
MånsT