Saya telah menemukan informasi sumbang pada pertanyaan: " Jika seseorang membangun interval kepercayaan 95% (CI) dari perbedaan dalam cara atau perbedaan dalam proporsi, apakah semua nilai dalam CI sama kemungkinannya? Atau, apakah estimasi titik adalah yang paling mungkin , dengan nilai di dekat "ekor" CI lebih kecil kemungkinannya dibandingkan dengan yang ada di tengah CI?
Misalnya, jika laporan uji klinis acak menyatakan bahwa risiko relatif kematian dengan pengobatan tertentu adalah 1,06 (95% CI 0,96 hingga 1,18), apakah kemungkinan 0,96 sebagai nilai yang benar sama dengan 1,06?
Saya menemukan banyak referensi untuk konsep ini secara online, tetapi dua contoh berikut mencerminkan ketidakpastian di dalamnya:
Modul Lisa Sullivan tentang status Interval Keyakinan :
Interval kepercayaan untuk perbedaan dalam cara menyediakan kisaran nilai yang mungkin untuk ( ). Penting untuk dicatat bahwa semua nilai dalam interval kepercayaan kemungkinan sama-sama merupakan estimasi nilai sebenarnya dari ( ).
Blogpost ini, berjudul Within the Margin of Error , menyatakan:
Apa yang ada dalam pikiran saya adalah kesalahpahaman tentang "margin of error" yang memperlakukan semua poin dalam interval kepercayaan sama kemungkinannya, seolah-olah teorema batas pusat menyiratkan distribusi seragam yang dibatasi bukan distribusi t . [...]
Hal yang terlewatkan oleh "margin of error" adalah bahwa kemungkinan yang mendekati perkiraan titik jauh lebih mungkin daripada kemungkinan yang ada di tepi margin ".
Ini tampaknya bertentangan, jadi mana yang benar?
sumber
Jawaban:
Satu pertanyaan yang perlu dijawab adalah apa arti "kemungkinan" dalam konteks ini?
Jika itu berarti probabilitas (karena kadang-kadang digunakan sebagai sinonim dari) dan kami menggunakan definisi frequentist yang ketat maka nilai parameter sebenarnya adalah nilai tunggal yang tidak berubah, sehingga probabilitas (kemungkinan) dari titik itu adalah 100% dan semua nilai lainnya adalah 0%. Jadi hampir semua sama-sama kemungkinan pada 0%, tetapi jika intervalnya berisi nilai sebenarnya, maka itu berbeda dari yang lain.
Jika kita menggunakan pendekatan Bayesian maka CI (Credible Interval) berasal dari distribusi posterior dan Anda dapat membandingkan kemungkinan di berbagai titik dalam interval. Kecuali jika posterior seragam sempurna dalam interval (secara teoritis mungkin saya kira, tapi itu akan menjadi keadaan yang aneh) maka nilainya memiliki kemungkinan yang berbeda.
Jika kita menggunakan kemungkinan mirip dengan kepercayaan diri maka pikirkan seperti ini: Hitunglah interval kepercayaan 95%, interval kepercayaan 90%, dan interval kepercayaan 85%. Kami akan yakin 5% bahwa nilai sebenarnya terletak di wilayah di dalam interval 95% tetapi di luar interval 90%, kita bisa mengatakan bahwa nilai sebenarnya adalah 5% kemungkinan jatuh di wilayah itu. Hal yang sama berlaku untuk wilayah yang berada di dalam interval 90% tetapi di luar interval 85%. Jadi jika setiap nilai memiliki kemungkinan yang sama, maka ukuran kedua wilayah di atas harus persis sama dan hal yang sama berlaku untuk wilayah di dalam interval kepercayaan 10% tetapi di luar interval kepercayaan 5%. Tidak ada distribusi standar yang menggunakan interval interval memiliki properti ini (kecuali kasus khusus dengan 1 menarik dari seragam).
Anda dapat membuktikannya lebih lanjut kepada diri Anda sendiri dengan mensimulasikan sejumlah besar dataset dari populasi yang diketahui, menghitung interval kepercayaan yang diinginkan, kemudian membandingkan seberapa sering parameter sebenarnya lebih dekat ke perkiraan titik daripada ke masing-masing titik akhir.
sumber
Ini pertanyaan yang bagus! Ada konsep matematika yang disebut kemungkinan yang akan membantu Anda memahami masalah. Fisher menemukan kemungkinan tetapi menganggapnya agak kurang diinginkan daripada probabilitas, tetapi kemungkinan ternyata lebih 'primitif' daripada probabilitas dan Ian Hacking (1965) menganggapnya sebagai aksiomatik dalam hal itu tidak dapat dibuktikan. Kemungkinan mendasari probabilitas daripada sebaliknya.
Peretasan, 1965. Logika Inferensi Statistik .
Kemungkinan tidak diberikan perhatian yang seharusnya ada dalam buku teks statistik standar, tanpa alasan yang bagus. Ini berbeda dari probabilitas memiliki hampir semua properti yang diharapkan, dan kemungkinan fungsi dan interval sangat berguna untuk inferensi. Mungkin kemungkinan tidak disukai oleh beberapa ahli statistik karena kadang-kadang tidak ada cara yang 'tepat' untuk mendapatkan fungsi kemungkinan yang relevan. Namun, dalam banyak kasus, fungsi kemungkinannya jelas dan didefinisikan dengan baik. Sebuah studi tentang kemungkinan inferensi mungkin harus dimulai dengan buku Richard Royall yang kecil dan mudah dipahami yang disebut Statistik Bukti: Paradigma Kemungkinan .
Jawaban atas pertanyaan Anda adalah tidak, titik-titik dalam interval apa pun tidak semuanya memiliki kemungkinan yang sama. Mereka yang berada di tepi interval kepercayaan biasanya memiliki kemungkinan lebih rendah daripada yang lain menuju pusat interval. Tentu saja, interval kepercayaan konvensional tidak memberi tahu Anda secara langsung tentang parameter yang relevan dengan percobaan tertentu. Interval kepercayaan Neyman bersifat 'global' karena dirancang untuk memiliki properti jangka panjang daripada properti 'lokal' yang relevan dengan eksperimen yang ada. (Untungnya kinerja jangka panjang yang baik dapat ditafsirkan di lokal, tapi itu adalah jalan pintas intelektual daripada realitas matematika.) Interval kemungkinan — dalam kasus-kasus di mana mereka dapat dibangun — secara langsung mencerminkan kemungkinan terkait eksperimen di tangan.
sumber
Misalkan seseorang mengatakan kepada saya bahwa saya harus menempatkan kepercayaan yang sama dalam semua nilai dalam CI95 sebagai indikator potensial dari nilai populasi. (Saya sengaja menghindari istilah "kemungkinan" dan "kemungkinan.") Apa yang istimewa tentang 95? Tidak ada: untuk menjadi konsisten saya juga harus menempatkan kepercayaan yang sama dalam semua nilai dalam CI96, CI97, ... dan CI99.9999999. Ketika cakupan CI mendekati batasnya, hampir semua bilangan real harus dimasukkan. Tidak masuk akal kesimpulan ini akan membuat saya menolak klaim awal.
sumber
Mari kita mulai dengan definisi interval kepercayaan diri. Jika saya mengatakan bahwa interval kepercayaan 95% beralih dari ini ke yang saya maksudkan bahwa pernyataan seperti itu akan benar sekitar 95% dari waktu dan salah sekitar 5% dari waktu. Saya tidak harus berarti bahwa saya 95% yakin tentang pernyataan khusus ini . Interval kepercayaan 90% akan lebih sempit dan 80% lebih sempit lagi. Oleh karena itu, ketika bertanya-tanya apa nilai sebenarnya, saya kurang memiliki kepercayaan pada nilai karena mereka semakin dekat ke tepi interval kepercayaan tertentu.
Perhatikan bahwa semua hal di atas adalah kualitatif, terutama "kepercayaan". (Saya menghindari istilah "kepercayaan diri" atau "kemungkinan" dalam pernyataan itu karena mereka membawa muatan matematika yang mungkin berbeda dari bagasi intuitif kami.) Pendekatan Bayesian akan menguraikan kembali pertanyaan Anda menjadi sesuatu yang memiliki jawaban kuantitatif tetapi saya tidak ingin membuka kaleng cacing di sini.
Kotak, teks klasik Hunter & Hunter ("Statistics for Experimenters", Wiley, 1978) juga dapat membantu. Lihat "Set Interval Keyakinan" pada halaman 113, ff.
sumber