Saya sedang membaca buku teks statistik tingkat entri. Dalam bab tentang estimasi kemungkinan maksimum proporsi keberhasilan dalam data dengan distribusi binomial, itu memberikan formula untuk menghitung interval kepercayaan dan kemudian dengan santai disebutkan.
Pertimbangkan probabilitas cakupan aktualnya, yaitu probabilitas bahwa metode tersebut menghasilkan interval yang menangkap nilai parameter sebenarnya. Ini mungkin sedikit kurang dari nilai nominal.
Dan berlanjut dengan saran untuk membangun "interval kepercayaan" alternatif, yang mungkin mengandung probabilitas cakupan aktual.
Saya dihadapkan dengan ide probabilitas cakupan nominal dan aktual untuk pertama kalinya. Menjelajahi pertanyaan-pertanyaan lama di sini, saya pikir saya mendapat pemahaman untuk itu: ada dua konsep yang berbeda yang kita sebut probabilitas, yang pertama adalah seberapa besar kemungkinan bahwa peristiwa yang belum terjadi akan menghasilkan hasil yang diberikan, dan yang kedua Adalah mungkin bahwa dugaan agen pengamat untuk hasil dari peristiwa yang sudah terjadi benar adanya. Tampaknya juga interval kepercayaan hanya mengukur jenis probabilitas pertama, dan sesuatu yang disebut "interval kredibel" mengukur jenis probabilitas kedua. Singkatnya saya berasumsi bahwa interval kepercayaan adalah yang menghitung "probabilitas cakupan nominal" dan interval yang kredibel adalah yang mencakup "probabilitas cakupan aktual".
Tetapi mungkin saya telah salah menafsirkan buku itu (tidak sepenuhnya jelas apakah metode perhitungan yang berbeda yang ditawarkannya adalah untuk interval kepercayaan dan interval kredibel, atau untuk dua jenis interval kepercayaan yang berbeda), atau sumber lain yang saya gunakan untuk datang ke pemahaman saya saat ini. Terutama komentar yang saya dapatkan pada pertanyaan lain,
Interval kepercayaan diri untuk frequentist, kredibel untuk Bayesian
membuat saya meragukan kesimpulan saya, karena buku itu tidak menjelaskan metode Bayesian dalam bab itu.
Jadi tolong jelaskan apakah pemahaman saya benar, atau jika saya telah membuat kesalahan logis di jalan.
Jawaban:
Secara umum, probabilitas cakupan aktual tidak akan pernah sama dengan probabilitas nominal ketika Anda bekerja dengan distribusi diskrit.
Interval kepercayaan didefinisikan sebagai fungsi data. Jika Anda bekerja dengan distribusi binomial, hanya ada finitely banyak kemungkinan hasil ( harus tepat), sehingga hanya ada finitely banyak interval kepercayaan mungkin. Karena parameter p adalah kontinu, sangat mudah untuk melihat bahwa probabilitas cakupan (yang merupakan fungsi dari p ) dapat melakukan tidak lebih baik daripada sekitar 95% (atau apa pun).n+1 p p
Secara umum benar bahwa metode berdasarkan CLT akan memiliki probabilitas cakupan di bawah nilai nominal, tetapi metode lain sebenarnya bisa lebih konservatif.
sumber
Cakupan nominal hanya tercapai ketika nilai parameter sebenarnya bertepatan dengan batas atas yang dapat diperoleh.
‡ Interval dengan batas atas & bawah lebih sering digunakan tentunya; tetapi sedikit lebih rumit untuk dijelaskan, & hanya ada satu interval yang tepat untuk dipertimbangkan hanya dengan batas atas. (Lihat Blaker (2000), "Kurva kepercayaan dan interval kepercayaan ditingkatkan untuk distribusi diskrit", Jurnal Statistik Kanada , 28 , 4 & referensi.)
sumber
Saya pikir perbedaannya sebenarnya tentang penggunaan perkiraan yang dibuat ketika menghitung interval kepercayaan. Sebagai contoh jika kita menggunakan CI yang cukup standar
sumber