Apakah menghitung "probabilitas cakupan aktual" sama dengan menghitung "interval kredibel"?

10

Saya sedang membaca buku teks statistik tingkat entri. Dalam bab tentang estimasi kemungkinan maksimum proporsi keberhasilan dalam data dengan distribusi binomial, itu memberikan formula untuk menghitung interval kepercayaan dan kemudian dengan santai disebutkan.

Pertimbangkan probabilitas cakupan aktualnya, yaitu probabilitas bahwa metode tersebut menghasilkan interval yang menangkap nilai parameter sebenarnya. Ini mungkin sedikit kurang dari nilai nominal.

Dan berlanjut dengan saran untuk membangun "interval kepercayaan" alternatif, yang mungkin mengandung probabilitas cakupan aktual.

Saya dihadapkan dengan ide probabilitas cakupan nominal dan aktual untuk pertama kalinya. Menjelajahi pertanyaan-pertanyaan lama di sini, saya pikir saya mendapat pemahaman untuk itu: ada dua konsep yang berbeda yang kita sebut probabilitas, yang pertama adalah seberapa besar kemungkinan bahwa peristiwa yang belum terjadi akan menghasilkan hasil yang diberikan, dan yang kedua Adalah mungkin bahwa dugaan agen pengamat untuk hasil dari peristiwa yang sudah terjadi benar adanya. Tampaknya juga interval kepercayaan hanya mengukur jenis probabilitas pertama, dan sesuatu yang disebut "interval kredibel" mengukur jenis probabilitas kedua. Singkatnya saya berasumsi bahwa interval kepercayaan adalah yang menghitung "probabilitas cakupan nominal" dan interval yang kredibel adalah yang mencakup "probabilitas cakupan aktual".

Tetapi mungkin saya telah salah menafsirkan buku itu (tidak sepenuhnya jelas apakah metode perhitungan yang berbeda yang ditawarkannya adalah untuk interval kepercayaan dan interval kredibel, atau untuk dua jenis interval kepercayaan yang berbeda), atau sumber lain yang saya gunakan untuk datang ke pemahaman saya saat ini. Terutama komentar yang saya dapatkan pada pertanyaan lain,

Interval kepercayaan diri untuk frequentist, kredibel untuk Bayesian

membuat saya meragukan kesimpulan saya, karena buku itu tidak menjelaskan metode Bayesian dalam bab itu.

Jadi tolong jelaskan apakah pemahaman saya benar, atau jika saya telah membuat kesalahan logis di jalan.

rumtscho
sumber
Probabilitas cakupan nominal adalah probabilitas cakupan "target": yang kami coba capai ketika kami memperoleh metode yang memberikan interval kepercayaan. Cakupan aktual adalah cakupan "benar". Beberapa orang mengatakan bahwa interval kepercayaan tepat ketika cakupan aktual sama dengan cakupan nominal. Scotchi dan Unwisdom telah menyebutkan bahwa interval kepercayaan tidak pernah tepat untuk data diskrit. Contoh lain adalah ketika kita menggunakan interval kepercayaan asimptotik: itu hanya tepat ketika . Saya benar-benar mengerti ide Anda karena "aktual" juga merupakan sinonim dari "sekarang". n
Stéphane Laurent

Jawaban:

5

Secara umum, probabilitas cakupan aktual tidak akan pernah sama dengan probabilitas nominal ketika Anda bekerja dengan distribusi diskrit.

Interval kepercayaan didefinisikan sebagai fungsi data. Jika Anda bekerja dengan distribusi binomial, hanya ada finitely banyak kemungkinan hasil ( harus tepat), sehingga hanya ada finitely banyak interval kepercayaan mungkin. Karena parameter p adalah kontinu, sangat mudah untuk melihat bahwa probabilitas cakupan (yang merupakan fungsi dari p ) dapat melakukan tidak lebih baik daripada sekitar 95% (atau apa pun).n+1pp

Secara umum benar bahwa metode berdasarkan CLT akan memiliki probabilitas cakupan di bawah nilai nominal, tetapi metode lain sebenarnya bisa lebih konservatif.

Tidak bijaksana
sumber
1
Berikut pernyataan resmi yang berguna dari definisi: Mengingat ruang sampel dan parameter yang tidak diketahui θ , sebuah 1 - α prosedur kepercayaan terdiri dari sepasang fungsi L U : ohm R sehingga P [ { ω Ω | [ L ( ω ) , U ( ω ) ] θ } ]1 -Ω,F,Pθ1α LU:ΩRSisi kiri ungkapan ini adalah probabilitas cakupan (perhatikan bahwa ini tergantung pada θ) dan RHS adalahtingkat kepercayaan nominal. Jika infimum (lebih dari Ω ) LHS sama dengan RHS maka prosedurnyatepat.
P[{ωΩ|[L(ω),U(ω)]θ}]1α.
coverage probabilityΩ
Unwisdom
8

ππ=π1π=π2π

xnπ

xπUPr(X=x|π=0.7)I(πU0.7)00.39303780.000729010.58180340.010206020.72866160.059535130.84683890.185220140.93715010.324135150.99148760.302526161.00000000.1176491
x 95%πU=π:[Pr(X>x|π)=0.95]π=0.7x10.989065π

pertanggungan

Cakupan nominal hanya tercapai ketika nilai parameter sebenarnya bertepatan dengan batas atas yang dapat diperoleh.

98%

ππ

‡ Interval dengan batas atas & bawah lebih sering digunakan tentunya; tetapi sedikit lebih rumit untuk dijelaskan, & hanya ada satu interval yang tepat untuk dipertimbangkan hanya dengan batas atas. (Lihat Blaker (2000), "Kurva kepercayaan dan interval kepercayaan ditingkatkan untuk distribusi diskrit", Jurnal Statistik Kanada , 28 , 4 & referensi.)

Scortchi - Reinstate Monica
sumber
Terima kasih telah menjawab. Sekarang saya tahu apa probabilitas cakupan yang sebenarnya, apakah Anda memiliki alasan mengapa pengguna dalam pertanyaan ini dikirim ke pertanyaan yang menjelaskan perbedaan antara interval kredibel dan kepercayaan? Di sinilah saya mendapat ide bahwa prob cakupan aktual / nominal. dualitas terkait. stats.stackexchange.com/questions/63922/…
rumtscho
Mungkin karena OP hanya memberikan tautan ke tempat dia melihat istilah "nominal" & "aktual" (daripada meringkas atau mengutipnya dalam pertanyaan seperti yang Anda lakukan), & kemudian mencurahkan sisa pertanyaannya ke salah tafsirnya terhadap gunakan dalam konteks itu.
Scortchi
2

Saya pikir perbedaannya sebenarnya tentang penggunaan perkiraan yang dibuat ketika menghitung interval kepercayaan. Sebagai contoh jika kita menggunakan CI yang cukup standar

estimate±1.96×estimated standard error

1000850

probabilityislogic
sumber