Contoh saat interval kepercayaan dan interval kredibel bertepatan

11

Dalam artikel wikipedia tentang Credible Interval , tertulis:

Untuk kasus parameter tunggal dan data yang dapat dirangkum dalam satu statistik yang cukup, dapat ditunjukkan bahwa interval kredibel dan interval kepercayaan akan bertepatan jika parameter yang tidak diketahui adalah parameter lokasi (yaitu fungsi probabilitas ke depan memiliki bentuk Pr (x | μ) = f (x - μ)), dengan sebelumnya yang merupakan distribusi flat yang seragam; [5] dan juga jika parameter yang tidak diketahui adalah parameter skala (yaitu fungsi probabilitas ke depan memiliki bentuk Pr (x) | s) = f (x / s)), dengan prior Jeffrey '[5] - yang berikutnya mengikuti karena mengambil logaritma parameter skala tersebut mengubahnya menjadi parameter lokasi dengan distribusi seragam. Tetapi ini adalah kasus yang jelas khusus (meskipun penting); secara umum tidak ada kesetaraan yang dapat dibuat. "

Bisakah orang memberikan contoh spesifik tentang ini? Kapan CI 95% benar-benar sesuai dengan "peluang 95%", sehingga "melanggar" definisi umum CI?

Wayne
sumber

Jawaban:

13

distribusi normal:

Ambil distribusi normal dengan varian yang diketahui. Kita dapat menganggap varians ini menjadi 1 tanpa kehilangan keumuman (dengan hanya membagi setiap pengamatan dengan akar kuadrat dari varians). Ini memiliki distribusi sampling:

p(X1...XN|μ)=(2π)N2exp(12i=1N(Xiμ)2)=Aexp(N2(X¯μ)2)

Di mana adalah konstanta yang hanya bergantung pada data. Ini menunjukkan bahwa rerata sampel adalah statistik yang cukup untuk rerata populasi. Jika kita menggunakan seragam sebelumnya, maka distribusi posterior untuk adalah:Aμ

(μ|X1...XN)Normal(X¯,1N)(N(μX¯)|X1...XN)Normal(0,1)

Jadi interval kredibilitas akan berbentuk:1α

(X¯+1NLα,X¯+1NUα)

Di mana dan dipilih sedemikian rupa sehingga variabel acak normal standar memenuhi:LαUαZ

Pr(Lα<Z<Uα)=1α

Sekarang kita dapat mulai dari "kuantitas penting" ini untuk membangun interval kepercayaan. Distribusi sampling dari untuk fix adalah distribusi normal standar, sehingga kami dapat menggantinya dengan probabilitas di atas:N(μX¯)μ

Pr(Lα<N(μX¯)<Uα)=1α

Kemudian atur ulang untuk menyelesaikan untuk , dan interval kepercayaan akan sama dengan interval yang kredibel.μ

Parameter skala:

Untuk parameter skala, pdf memiliki bentuk . Kita dapat mengambil , yang sesuai dengan . Distribusi joint sampling adalah:p(Xi|s)=1sf(Xis)(Xi|s)Uniform(0,s)f(t)=1

p(X1...XN|s)=sN0<X1...XN<s

Dari mana kami menemukan statistik yang cukup untuk menjadi sama dengan (maksimum pengamatan). Kami sekarang menemukan distribusi samplingnya:Xmax

Pr(Xmax<y|s)=Pr(X1<y,X2<y...XN<y|s)=(ys)N

Sekarang kita dapat membuat ini tidak tergantung pada parameter dengan mengambil . Ini berarti "kuantitas penting" kami diberikan oleh dengan yang merupakan distribusi . Jadi, kita dapat memilih menggunakan beta quantiles sedemikian rupa sehingga:y=qsQ=s1XmaxPr(Q<q)=qNbeta(N,1)Lα,Uα

Pr(Lα<Q<Uα)=1α=UαNLαN

Dan kami mengganti kuantitas penting:

Pr(Lα<s1Xmax<Uα)=1α=Pr(XmaxLα1>s>XmaxUα1)

Dan ada interval kepercayaan diri kita. Untuk solusi Bayesian dengan jeffrey sebelumnya, kami memiliki:

p(s|X1...XN)=sN1XmaxrN1dr=N(Xmax)NsN1
Pr(s>t|X1...XN)=N(Xmax)NtsN1ds=(Xmaxt)N

Kami sekarang memasukkan interval kepercayaan, dan menghitung kredibilitasnya

Pr(XmaxLα1>s>XmaxUα1|X1...XN)=(XmaxXmaxUα1)N(XmaxXmaxLα1)N

=UαNLαN=Pr(Lα<Q<Uα)

Dan presto, kami memiliki kredibilitas dan jangkauan .1α

probabilityislogic
sumber
Sebuah mahakarya, terima kasih! Saya berharap bahwa mungkin ada jawaban seperti, "ketika menghitung rata-rata sampel dari distribusi Normal, 95% CI sebenarnya juga 95% Kredibel Interval" atau sesuatu yang sederhana seperti itu. (Hanya mengada-ada jawaban yang seharusnya, saya tidak tahu tentang contoh-contoh spesifik.)
Wayne
Saya percaya bahwa interval prediksi / toleransi 95% yang sering terjadi sesuai dengan interval prediksi Bayesian dengan regresi OLS dan kesalahan normal. Tampaknya begitu ketika saya membandingkan jawaban predict.lm dengan jawaban yang disimulasikan, bagaimanapun. Benarkah itu?
Wayne
Untuk , Jika Anda menggunakan seragam sebelum dan jeffrey sebelum untuk , maka Anda memiliki kesetaraan. Y=α+βXα,βσ
probabilityislogic
Terima kasih banyak! Saya telah mencoba menjelaskan CI untuk regresi yang telah saya lakukan dalam hal Confidence Interval, dan itu hanya tidak terhubung dengan audiens awam, yang mengharapkan Credible Interval. Membuat hidup saya lebih mudah ... meskipun mungkin itu buruk bagi dunia statistik secara keseluruhan, karena itu akan memperkuat kesalahpahaman orang awam tentang CI.
Wayne
@Wayne - situasinya sedikit lebih umum daripada keluarga skala lokasi saja. Biasanya CI akan setara dengan interval yang kredibel, jika didasarkan pada "statistik yang cukup" (seperti keduanya) di mana ini ada. Jika tidak ada statistik yang memadai, maka CI perlu mengkondisikan pada apa yang disebut "statistik tambahan" untuk memiliki interpretasi interval yang kredibel.
probabilityislogic