Apakah interval kepercayaan benar-benar memberikan ukuran ketidakpastian estimasi parameter?

12

Saya sedang membaca posting blog oleh ahli statistik William Briggs, dan klaim berikut ini membuat saya sedikit tertarik.

Apa yang Anda dapatkan dari itu?

Apa itu interval kepercayaan? Ini adalah persamaan, tentu saja, yang akan memberi Anda interval untuk data Anda. Ini dimaksudkan untuk memberikan ukuran ketidakpastian estimasi parameter. Sekarang, sesuai dengan teori frequentist — yang bahkan dapat kita anggap benar — satu-satunya hal yang dapat Anda katakan tentang CI yang Anda miliki adalah bahwa nilai sebenarnya dari parameter terletak di dalamnya atau tidak. Ini adalah tautologi, oleh karena itu selalu benar. Dengan demikian, CI tidak memberikan ukuran ketidakpastian sama sekali: pada kenyataannya, latihan yang sia-sia untuk menghitungnya.

Tautan: http://wmbriggs.com/post/3169/

Lima σ
sumber
3
Tanpa referensi yang tepat, yang paling penting, tidak ada konteks di sini. Juga tidak ada cara untuk mendapatkan indikasi gaya dan kredensial William Briggs (tidak saya kenal). Bisa jadi di sini ada seseorang yang suka bersikap provokatif dan keterlaluan. Ada, secara alami, masalah teknis dan filosofis yang dalam dan sulit di sini juga, yang merupakan pertanyaan, tetapi meminta kami untuk memperdebatkan kutipan tanpa latar belakang (hanya satu tampilan) tidak mungkin berhasil.
Nick Cox
1
@NickCox Berkenaan dengan penghilangan konteks yang relevan, saya sekarang telah mengedit posting awal.
Lima σ
6
Terima kasih banyak telah menyediakan cadangan. Itu hanya komentar dan saya tidak memiliki kecenderungan untuk memperpanjangnya, tetapi reaksi tiga kata saya adalah bahwa kalimat terakhir adalah klaim yang dilebih-lebihkan . Anda dapat berharap untuk jawaban yang lebih lengkap.
Nick Cox
1
@NickCox Tidak masalah Nick. Namun, saya sangat menghargai sentimen Anda karena ceroboh saya untuk tidak merujuk pertanyaan saya.
Lima σ
2
@Nick Saya akan mengatakan Briggs berhasil dalam salah satu dari dua tujuannya: "Pikiran hari ini hanyalah sebuah sketsa untuk membantu menjernihkan pikiran saya dan memulai diskusi. Artinya, kemungkinan saya akan menjadi mangsa keluhan saya sendiri" (bahwa lingkungan "Anda" ahli statistik "adalah" pemikir ceroboh ").
whuber

Jawaban:

24

Dia merujuk, agak kikuk, ke fakta yang diketahui bahwa analisis frequentist tidak memodelkan keadaan pengetahuan kita tentang parameter yang tidak diketahui dengan distribusi probabilitas, jadi setelah menghitung interval kepercayaan (katakanlah 95%) (katakanlah 1,2 hingga 3,4) untuk parameter populasi (katakanlah rerata distribusi Gaussian) dari beberapa data yang tidak dapat Anda lanjutkan & klaim bahwa ada kemungkinan 95% rerata jatuh antara 1,2 dan 3,4. Probabilitasnya satu atau nol — Anda tidak tahu yang mana. Tetapi yang dapat Anda katakan, secara umum, adalah bahwa prosedur Anda untuk menghitung interval kepercayaan 95% adalah prosedur yang memastikan mereka mengandung nilai parameter sebenarnya 95% dari waktu. Ini tampaknya alasan yang cukup untuk mengatakan bahwa CI mencerminkan ketidakpastian. Seperti yang dikatakan Sir David Cox

Kami mendefinisikan prosedur untuk menilai bukti yang dikalibrasi oleh bagaimana mereka akan melakukan itu digunakan berulang kali. Dalam arti mereka tidak berbeda dari alat ukur lainnya.

Lihat di sini & di sini untuk penjelasan lebih lanjut.

Hal-hal lain yang dapat Anda katakan berbeda-beda sesuai dengan metode tertentu yang Anda gunakan untuk menghitung interval kepercayaan; jika Anda memastikan nilai-nilai di dalam memiliki kemungkinan yang lebih besar, mengingat data, daripada poin di luar, maka Anda dapat mengatakan bahwa (& sering kali hampir benar untuk metode yang umum digunakan). Lihat di sini untuk lebih lanjut.

† Cox (2006), Prinsip Inferensi Statistik , §1.5.2

Scortchi - Reinstate Monica
sumber
1
Itu Sir David Cox, saya kira.
Nick Cox
@NickCox: Memang.
Scortchi
Apakah analogi yang dikutip Sir David benar? (Bukan kutipan yang benar, tetapi analogi yang benar.) Saya tidak membayangkan termometer yang 95% waktunya melaporkan suhu , tetapi 5% dari waktu melaporkan suhu di luar - dan mungkin jauh di luar kisaran itu? ± ϵ±ϵ±ϵ
Wayne
1
@Spectrosaurus: Tulisan yang saya tautkan untuk membahas ini lebih detail. Dalam keadaan baik, rata-rata populasi tidak dimodelkan sebagai variabel acak; data adalah, dengan distribusi yang bergantung pada , & interval kepercayaan adalah fungsi dari data. mendefinisikan interval kepercayaan yang valid dengan 95% cakupan, nilai apa pun mungkin. Jadi jika , ...μXμμ(bL(Xμ),bU(Xμ))Pr[bU(Xμ)<μ<bU(Xμ)]=0.95μμ=2
Scortchi - Pasang kembali Monica
1
... benar, & jika , benar. Sekarang menggantikan nilai realisasi memberikan misalnya , yaitu jika , & jika , - yang merupakan omong kosong. μ = 7Pr[bU(X2)<2<bU(X2)]=0.95μ=7Pr[bU(X7)<7<bU(X7)]=0.95XμPr[1.2<μ<3.4]=0.95Pr [ 1.2 < 2 < 3.4 ] = 0.95 μ = 7 Pr [ 1.2 < 2 < 3.4 ] = 0.95μ=2Pr[1.2<2<3.4]=0.95μ=7Pr[1.2<2<3.4]=0.95
Scortchi
2

Sulit untuk secara matematis mengkarakterisasi ketidakpastian, tetapi saya tahu ketika saya melihatnya; biasanya memiliki interval kepercayaan 95% yang luas.

N Brouwer
sumber