Apakah semua nilai dalam interval kepercayaan 95% sama-sama mungkin?

56

Saya telah menemukan informasi sumbang pada pertanyaan: " Jika seseorang membangun interval kepercayaan 95% (CI) dari perbedaan dalam cara atau perbedaan dalam proporsi, apakah semua nilai dalam CI sama kemungkinannya? Atau, apakah estimasi titik adalah yang paling mungkin , dengan nilai di dekat "ekor" CI lebih kecil kemungkinannya dibandingkan dengan yang ada di tengah CI?

Misalnya, jika laporan uji klinis acak menyatakan bahwa risiko relatif kematian dengan pengobatan tertentu adalah 1,06 (95% CI 0,96 hingga 1,18), apakah kemungkinan 0,96 sebagai nilai yang benar sama dengan 1,06?

Saya menemukan banyak referensi untuk konsep ini secara online, tetapi dua contoh berikut mencerminkan ketidakpastian di dalamnya:

  1. Modul Lisa Sullivan tentang status Interval Keyakinan :

    Interval kepercayaan untuk perbedaan dalam cara menyediakan kisaran nilai yang mungkin untuk ( ). Penting untuk dicatat bahwa semua nilai dalam interval kepercayaan kemungkinan sama-sama merupakan estimasi nilai sebenarnya dari ( ).μ1μ2μ1μ2

  2. Blogpost ini, berjudul Within the Margin of Error , menyatakan:

    Apa yang ada dalam pikiran saya adalah kesalahpahaman tentang "margin of error" yang memperlakukan semua poin dalam interval kepercayaan sama kemungkinannya, seolah-olah teorema batas pusat menyiratkan distribusi seragam yang dibatasi bukan distribusi t . [...]
    Hal yang terlewatkan oleh "margin of error" adalah bahwa kemungkinan yang mendekati perkiraan titik jauh lebih mungkin daripada kemungkinan yang ada di tepi margin ".

Ini tampaknya bertentangan, jadi mana yang benar?

pmgjones
sumber
7
Saya bertanya-tanya apakah ada kebingungan di suatu tempat dengan konsep terkait bahwa nilai-p terdistribusi secara merata di bawah hipotesis nol ..
Michael McGowan
4
Kutipan pertama adalah slip menyimpang dalam akun interval kepercayaan yang dinyatakan akurat. Kutipan kedua adalah dari akun yang, dengan kata lain, adalah berantakan ceroboh: itu penuh dengan pernyataan yang tidak jelas, salah, atau hanya dapat diartikan dalam pengertian Bayesian. Namun kedua kutipan itu salah !
whuber
@whuber Saya tidak akan menyebut yang kedua berantakan ... Saya akan menyebutnya interpretasi Bayesian dari interpretasi Frequentist :)
Michael McGowan
1
@Michael Salah satu contoh kecerobohan adalah solecism seperti menyatakan CLT menyiratkan "tak terhitung jumlah perkiraan berulang [dari populasi] masih akan mengikuti distribusi normal." Seseorang tidak harus salah untuk mengkomunikasikan ide-ide hanya kepada audiens yang tidak teknis.
whuber
2
@whuber, saya menganggap kalimat yang Anda kutip hanya dosa kecil. Kesalahan utama adalah bahwa CLT tidak melibatkan distribusi t.
Kaca

Jawaban:

23

Satu pertanyaan yang perlu dijawab adalah apa arti "kemungkinan" dalam konteks ini?

Jika itu berarti probabilitas (karena kadang-kadang digunakan sebagai sinonim dari) dan kami menggunakan definisi frequentist yang ketat maka nilai parameter sebenarnya adalah nilai tunggal yang tidak berubah, sehingga probabilitas (kemungkinan) dari titik itu adalah 100% dan semua nilai lainnya adalah 0%. Jadi hampir semua sama-sama kemungkinan pada 0%, tetapi jika intervalnya berisi nilai sebenarnya, maka itu berbeda dari yang lain.

Jika kita menggunakan pendekatan Bayesian maka CI (Credible Interval) berasal dari distribusi posterior dan Anda dapat membandingkan kemungkinan di berbagai titik dalam interval. Kecuali jika posterior seragam sempurna dalam interval (secara teoritis mungkin saya kira, tapi itu akan menjadi keadaan yang aneh) maka nilainya memiliki kemungkinan yang berbeda.

Jika kita menggunakan kemungkinan mirip dengan kepercayaan diri maka pikirkan seperti ini: Hitunglah interval kepercayaan 95%, interval kepercayaan 90%, dan interval kepercayaan 85%. Kami akan yakin 5% bahwa nilai sebenarnya terletak di wilayah di dalam interval 95% tetapi di luar interval 90%, kita bisa mengatakan bahwa nilai sebenarnya adalah 5% kemungkinan jatuh di wilayah itu. Hal yang sama berlaku untuk wilayah yang berada di dalam interval 90% tetapi di luar interval 85%. Jadi jika setiap nilai memiliki kemungkinan yang sama, maka ukuran kedua wilayah di atas harus persis sama dan hal yang sama berlaku untuk wilayah di dalam interval kepercayaan 10% tetapi di luar interval kepercayaan 5%. Tidak ada distribusi standar yang menggunakan interval interval memiliki properti ini (kecuali kasus khusus dengan 1 menarik dari seragam).

Anda dapat membuktikannya lebih lanjut kepada diri Anda sendiri dengan mensimulasikan sejumlah besar dataset dari populasi yang diketahui, menghitung interval kepercayaan yang diinginkan, kemudian membandingkan seberapa sering parameter sebenarnya lebih dekat ke perkiraan titik daripada ke masing-masing titik akhir.

Greg Snow
sumber
3
Kemungkinan adalah apa yang dibutuhkan pertanyaan ini dalam jawaban, bukan probabilitas, baik frequentist atau Bayesian. Kemungkinan memberikan jawaban yang tepat, yang lain hanya dapat melakukannya dengan beberapa gerakan memutar dan peregangan.
Michael Lew
1
@ Greg Saya suka penjelasan Anda. Hanya untuk memperjelas, argumen Anda mendukung gagasan bahwa nilai pada "ekor" CI 95% lebih kecil kemungkinannya (lebih kecil kemungkinannya) daripada yang lebih dekat dengan estimasi titik, betul? Terimakasih atas tanggapan Anda.
pmgjones
1
@pmgjones kurang memungkinkan, TIDAK, lihat paragraf ke-2. Lebih kecil kemungkinannya dalam konteks paragraf 4, Ya.
Greg Snow
2
@GregSnow Paragraf ke-2 Anda mengatakan hampir persis bahwa probabilitas parameter sejati menjadi parameter sebenarnya adalah 100%. Apakah Anda benar-benar percaya bahwa tautologi ini adalah apa yang ditawarkan "definisi sering yang ketat"?
rolando2
2
@ rolando2, saya pikir statistik frequentist memiliki banyak hal untuk ditawarkan, saya hanya menghilangkan salah saji umum yang menyiratkan perubahan nilai sebenarnya dan kadang-kadang di luar interval dan kadang-kadang di dalam interval (dan kadang-kadang lebih dekat ke batas dan kadang-kadang lebih dekat ke batas pusat). Paragraf-paragraf kemudian mendapatkan perasaan yang lebih benar untuk ide-ide.
Greg Snow
19

Ini pertanyaan yang bagus! Ada konsep matematika yang disebut kemungkinan yang akan membantu Anda memahami masalah. Fisher menemukan kemungkinan tetapi menganggapnya agak kurang diinginkan daripada probabilitas, tetapi kemungkinan ternyata lebih 'primitif' daripada probabilitas dan Ian Hacking (1965) menganggapnya sebagai aksiomatik dalam hal itu tidak dapat dibuktikan. Kemungkinan mendasari probabilitas daripada sebaliknya.

Peretasan, 1965. Logika Inferensi Statistik .

Kemungkinan tidak diberikan perhatian yang seharusnya ada dalam buku teks statistik standar, tanpa alasan yang bagus. Ini berbeda dari probabilitas memiliki hampir semua properti yang diharapkan, dan kemungkinan fungsi dan interval sangat berguna untuk inferensi. Mungkin kemungkinan tidak disukai oleh beberapa ahli statistik karena kadang-kadang tidak ada cara yang 'tepat' untuk mendapatkan fungsi kemungkinan yang relevan. Namun, dalam banyak kasus, fungsi kemungkinannya jelas dan didefinisikan dengan baik. Sebuah studi tentang kemungkinan inferensi mungkin harus dimulai dengan buku Richard Royall yang kecil dan mudah dipahami yang disebut Statistik Bukti: Paradigma Kemungkinan .

Jawaban atas pertanyaan Anda adalah tidak, titik-titik dalam interval apa pun tidak semuanya memiliki kemungkinan yang sama. Mereka yang berada di tepi interval kepercayaan biasanya memiliki kemungkinan lebih rendah daripada yang lain menuju pusat interval. Tentu saja, interval kepercayaan konvensional tidak memberi tahu Anda secara langsung tentang parameter yang relevan dengan percobaan tertentu. Interval kepercayaan Neyman bersifat 'global' karena dirancang untuk memiliki properti jangka panjang daripada properti 'lokal' yang relevan dengan eksperimen yang ada. (Untungnya kinerja jangka panjang yang baik dapat ditafsirkan di lokal, tapi itu adalah jalan pintas intelektual daripada realitas matematika.) Interval kemungkinan — dalam kasus-kasus di mana mereka dapat dibangun — secara langsung mencerminkan kemungkinan terkait eksperimen di tangan.

Michael Lew
sumber
1
@suncoolsu Tidak perlu bahwa interval yang dimaksud menjadi interval kemungkinan untuk pernyataan itu benar. Interval hanya perlu merentang estimasi yang paling mungkin sehingga batas interval masing-masing lebih kecil kemungkinannya daripada titik dalam interval. Setiap interval kepercayaan biasa akan memenuhi persyaratan itu.
Michael Lew
2
@ pmjones A 95% CI TIDAK AKAN memberitahu Anda jika nilai-nilai menuju margin CI lebih dekat dengan kebenaran daripada nilai-nilai di tengah. CI membuat pernyataan tentang pengambilan sampel berulang dari populasi. Dalam jangka panjang (yaitu, setelah pengambilan sampel berulang), 95% dari CI tersebut, yang dibangun untuk setiap sampel, akan mencakup nilai sebenarnya. Oleh karena itu, ada dua pengamatan utama 1) Seseorang tidak bisa mengatakan apa-apa tentang nilai sebenarnya untuk CI yang diberikan 2) CI tidak memberi tahu Anda apa-apa tentang data yang diamati, yang merupakan kritik Bayesian biasa.
suncoolsu
1
Prinsip @MichaelLew Likelihood berguna, tetapi saya mengatakan bahwa (mengutip LW) "Memang, semua kesimpulan sering melanggar LP, jadi jika kita mematuhi LP kita harus meninggalkan kesimpulan sering." Karena CI adalah ide yang sering, itu melanggar LP (yang Anda katakan sangat mendasar).
suncoolsu
1
@suncollsu Pertanyaannya bukan apakah interval kepercayaan saja dan tanpa pertimbangan statistik lain memberi tahu apa pun tentang kemungkinan nilai parameter di dalam dirinya sendiri. Ini tentang kemungkinan nilai parameter dalam interval. Fungsi kemungkinan menjawab pertanyaan, dan jawaban itu benar bahkan jika interval kepercayaan melanggar prinsip kemungkinan. (Baca lagi komentar saya sebelumnya. Tampaknya Anda mengabaikan isinya sepenuhnya.)
Michael Lew
2
@ rolando2 Interval kepercayaan 95% Neyman dirancang sehingga metode tersebut berisi parameter sebenarnya pada 95% kesempatan metode digunakan. Tegasnya, kepercayaan diri melekat pada metode dan bukan pada interval individual apa pun sehingga interval individual tidak memberi tahu Anda apa-apa tentang keadaan dunia dalam percobaan khusus itu. Lihat jawaban saya untuk pertanyaan ini untuk lebih detail: stats.stackexchange.com/questions/8844/…
Michael Lew
18

Misalkan seseorang mengatakan kepada saya bahwa saya harus menempatkan kepercayaan yang sama dalam semua nilai dalam CI95 sebagai indikator potensial dari nilai populasi. (Saya sengaja menghindari istilah "kemungkinan" dan "kemungkinan.") Apa yang istimewa tentang 95? Tidak ada: untuk menjadi konsisten saya juga harus menempatkan kepercayaan yang sama dalam semua nilai dalam CI96, CI97, ... dan CI99.9999999. Ketika cakupan CI mendekati batasnya, hampir semua bilangan real harus dimasukkan. Tidak masuk akal kesimpulan ini akan membuat saya menolak klaim awal.

rolando2
sumber
4
Ini jawaban yang bagus! Seharusnya saya memikirkan efek mendekati ekstrem dari CI yang mungkin. Terima kasih telah menulis ini!
pmgjones
2

Mari kita mulai dengan definisi interval kepercayaan diri. Jika saya mengatakan bahwa interval kepercayaan 95% beralih dari ini ke yang saya maksudkan bahwa pernyataan seperti itu akan benar sekitar 95% dari waktu dan salah sekitar 5% dari waktu. Saya tidak harus berarti bahwa saya 95% yakin tentang pernyataan khusus ini . Interval kepercayaan 90% akan lebih sempit dan 80% lebih sempit lagi. Oleh karena itu, ketika bertanya-tanya apa nilai sebenarnya, saya kurang memiliki kepercayaan pada nilai karena mereka semakin dekat ke tepi interval kepercayaan tertentu.

Perhatikan bahwa semua hal di atas adalah kualitatif, terutama "kepercayaan". (Saya menghindari istilah "kepercayaan diri" atau "kemungkinan" dalam pernyataan itu karena mereka membawa muatan matematika yang mungkin berbeda dari bagasi intuitif kami.) Pendekatan Bayesian akan menguraikan kembali pertanyaan Anda menjadi sesuatu yang memiliki jawaban kuantitatif tetapi saya tidak ingin membuka kaleng cacing di sini.

Kotak, teks klasik Hunter & Hunter ("Statistics for Experimenters", Wiley, 1978) juga dapat membantu. Lihat "Set Interval Keyakinan" pada halaman 113, ff.

Emil Friedman
sumber
Karena kita berurusan sebagian dalam konsep dan sebagian dalam semantik, saya akan menunjukkan bahwa dalam kalimat kedua Anda, Anda telah mengatakan "... pernyataan yang sifatnya akan benar ..." tanpa menentukan pernyataan apa yang akan benar.
rolando2