Saya tahu secara kasar dan tidak resmi apa itu interval kepercayaan diri. Namun, sepertinya saya tidak bisa membungkus kepala saya di sekitar satu detail yang agak penting: Menurut Wikipedia:
Interval kepercayaan tidak memprediksi bahwa nilai sebenarnya dari parameter memiliki probabilitas tertentu berada dalam interval kepercayaan mengingat data benar-benar diperoleh.
Saya juga melihat poin serupa yang dibuat di beberapa tempat di situs ini. Definisi yang lebih benar, juga dari Wikipedia, adalah:
jika interval kepercayaan dibangun di banyak analisis data terpisah dari percobaan yang diulang (dan mungkin berbeda), proporsi interval tersebut yang mengandung nilai sebenarnya dari parameter akan mendekati tingkat kepercayaan
Sekali lagi, saya telah melihat poin serupa dibuat di beberapa tempat di situs ini. Saya tidak mengerti. Jika, di bawah eksperimen berulang, fraksi interval kepercayaan yang dihitung yang berisi parameter sebenarnya adalah , lalu bagaimana probabilitas bahwa dalam interval kepercayaan yang dihitung untuk percobaan sebenarnya adalah selain dari ? Saya mencari yang berikut dalam sebuah jawaban:θ ( 1 - α )
Klarifikasi perbedaan antara definisi yang salah dan benar di atas.
Definisi formal dan tepat dari interval kepercayaan yang dengan jelas menunjukkan mengapa definisi pertama salah.
Contoh nyata dari kasus di mana definisi pertama salah secara spektakuler, bahkan jika model yang mendasarinya benar.
sumber
mu
, dan, B) variabilitas berarti replikasi sekitarmu
. Kebanyakan orang lupa A: CI asli tidak perlu dibangun di sekitarmu
!Jawaban:
Saya menemukan eksperimen pikiran ini bermanfaat ketika memikirkan interval kepercayaan. Itu juga menjawab pertanyaan Anda 3.
Misalkan dan Y = X + a - 1X∼U(0,1) . Pertimbangkan dua pengamatanYmengambil nilai-nilaiy1dany2sesuai dengan pengamatanx1danx2dariX, dan biarkanyl=min(y1,y2)danyu=max(y1,y2). Maka[yl,yu]adalah interval kepercayaan 50% untukaY=X+a−12 Y y1 y2 x1 x2 X yl=min(y1,y2) yu=max(y1,y2) [yl,yu] a (karena interval menyertakan jika x 1 < 1a ataux1>1x1<12<x2 , yang masing-masing memiliki probabilitas1x1>12> x2 ).14
Namun, jika maka kita tahu bahwa probabilitas bahwa interval berisiaadalah1, bukan1ykamu- yl> 12 Sebuah 1 . Kehalusannya adalah bahwainterval kepercayaanz%untuk suatu parameter berarti bahwa titik akhir interval (yang merupakan variabel acak) terletak di kedua sisi parameter dengan probabilitasz%sebelum Anda menghitung interval, bukan berarti probabilitas parameter berada di dalam Intervalnya adalahz%setelah Anda menghitung intervalnya.12 z% z% z%
sumber
Ada banyak masalah tentang interval kepercayaan, tetapi mari kita fokus pada kutipan. Masalahnya terletak pada kemungkinan salah tafsir alih-alih masalah kebenaran. Ketika orang mengatakan "parameter memiliki probabilitas tertentu" sesuatu, mereka memikirkan parameter sebagai variabel acak. Ini bukan sudut pandang prosedur interval kepercayaan (klasik), yang variabel acaknya adalah interval itu sendiri dan parameternya ditentukan, bukan acak, namun tidak diketahui. Inilah sebabnya mengapa pernyataan seperti itu sering diserang.
Secara matematis, jika kita membiarkan prosedur apa pun yang memetakan data x = ( x i ) ke himpunan bagian dari ruang parameter dan jika (tidak peduli apa nilai dari parameter θ mungkin) pernyataan θ ∈ t ( x ) mendefinisikan suatu peristiwa A ( x ) , maka - menurut definisi - memiliki probabilitas Pr θ ( A ( x ) ) untuk setiap nilai yang mungkin dari θ . Ketika t adalah prosedur interval kepercayaan dengan keyakinan 1 -t x =( xsaya) θ θ ∈ t ( x ) A ( x ) Prθ( A ( x ) ) θ t maka probabilitas ini seharusnya memiliki nilai maksimum (di atas semua nilai parameter) 1 - α . (Tunduk pada kriteria ini, kami biasanya memilih prosedur yang mengoptimalkan beberapa properti tambahan, seperti menghasilkan interval kepercayaan pendek atau simetris, tapi itu masalah terpisah.) Hukum Lemah Angka Besar kemudian membenarkan kutipan kedua. Namun, itu bukan definisi interval kepercayaan: itu hanya properti yang mereka miliki.1 - α 1 - α
Saya pikir analisis ini telah menjawab pertanyaan 1, menunjukkan bahwa premis pertanyaan 2 salah, dan membuat pertanyaan 3 dapat diperdebatkan.
sumber
Saya tidak akan menyebut definisi CI sebagai salah, tetapi mereka mudah untuk diartikan salah, karena ada lebih dari satu definisi probabilitas. CI didasarkan pada definisi Probabilitas (Frequentist atau ontologis) berikut ini
(1) probabilitas suatu proposisi = proporsi jangka panjang dari waktu yang proposisi itu amati benar, tergantung pada proses menghasilkan data
Dengan demikian, agar valid secara konseptual dalam menggunakan CI, Anda harus menerima definisi probabilitas ini. Jika tidak, maka interval Anda bukan CI, dari sudut pandang teoretis.
Inilah sebabnya mengapa definisi menggunakan proporsi kata dan BUKAN kata probabilitas , untuk memperjelas bahwa definisi "frekuensi jangka panjang" probabilitas digunakan.
Definisi alternatif utama Probabilitas (Epistemologis atau probabilitas sebagai perpanjangan Logika deduktif atau Bayesian) adalah
(2) probabilitas suatu proposisi = tingkat kepercayaan rasional bahwa proposisi itu benar, tergantung pada kondisi pengetahuan
Orang sering kali secara intuisi menggabungkan kedua definisi ini, dan menggunakan interpretasi mana pun yang terjadi untuk menarik intuisi mereka. Ini dapat membawa Anda ke semua jenis situasi yang membingungkan (terutama ketika Anda berpindah dari satu paradigma ke paradigma lain).
Bahwa kedua pendekatan tersebut sering mengarah pada hasil yang sama, artinya dalam beberapa kasus kami memiliki:
tingkat kepercayaan rasional bahwa proposisi itu benar, tergantung pada kondisi pengetahuan = proporsi jangka panjang dari proposisi yang diamati benar, tergantung pada proses menghasilkan data
Intinya adalah bahwa ia tidak berlaku secara universal , jadi kita tidak dapat mengharapkan dua definisi yang berbeda untuk selalu mengarah pada hasil yang sama. Jadi, kecuali jika Anda benar-benar menemukan solusi Bayesian, dan kemudian menemukan itu menjadi interval yang sama, Anda tidak dapat memberikan interval yang diberikan oleh CI interpretasi sebagai kemungkinan mengandung nilai sebenarnya. Dan jika Anda melakukannya, maka intervalnya bukan Interval Keyakinan, tetapi Interval yang Dapat Dipercaya.
sumber
RA Fisher memiliki kriteria untuk kegunaan interval kepercayaan: CI harus tidak mengakui "himpunan bagian yang dapat diidentifikasi" yang menyiratkan tingkat kepercayaan yang berbeda. Dalam sebagian besar (jika tidak semua) contoh tandingan, kami memiliki kasus di mana ada himpunan bagian yang dapat diidentifikasi yang memiliki probabilitas cakupan yang berbeda.
Dalam kasus ini, Anda bisa menggunakan interval kredit Bayesian untuk menentukan pengertian subjektif di mana parameter berada, atau Anda dapat merumuskan interval kemungkinan untuk mencerminkan ketidakpastian relatif dalam parameter, mengingat data.
Sebagai contoh, satu kasus yang tampaknya relatif bebas kontradiksi adalah interval kepercayaan normal 2 sisi untuk rata-rata populasi. Dengan asumsi pengambilan sampel dari populasi normal dengan std. Yang diberikan, CI 95% mengakui tidak ada himpunan bagian yang dapat diidentifikasi yang akan memberikan informasi lebih lanjut tentang parameter. Ini dapat dilihat oleh fakta bahwa rata-rata sampel adalah statistik yang cukup dalam fungsi kemungkinan - yaitu, fungsi kemungkinan independen dari nilai-nilai sampel individu setelah kita tahu rata-rata sampel.
Alasan kami memiliki kepercayaan subyektif dalam CI simetris 95% untuk rata-rata normal lebih sedikit dari probabilitas cakupan yang dinyatakan dan lebih dari fakta bahwa 95% CI simetris untuk rata-rata normal adalah interval "kemungkinan tertinggi", yaitu, semua nilai parameter dalam interval memiliki kemungkinan lebih tinggi daripada nilai parameter di luar interval. Namun, karena kemungkinan bukan probabilitas (dalam arti akurasi jangka panjang), itu lebih merupakan kriteria subyektif (seperti penggunaan sebelumnya dan kemungkinan Bayesian). Singkatnya, ada banyak interval tak berhingga untuk mean normal yang memiliki probabilitas cakupan 95%, tetapi hanya CI simetris yang memiliki plausbilti intuitif yang kita harapkan dari perkiraan interval.
Oleh karena itu, kriteria RA Fisher menyiratkan bahwa probabilitas cakupan harus sama dengan kepercayaan subyektif hanya jika mengakui tidak ada dari himpunan bagian yang dapat diidentifikasi. Jika himpunan bagian hadir, maka probabilitas cakupan akan tergantung pada nilai sebenarnya dari parameter yang menggambarkan himpunan bagian. Untuk mendapatkan interval dengan tingkat kepercayaan intuitif, Anda perlu mengkondisikan interval interval pada statistik tambahan yang sesuai yang membantu mengidentifikasi subset. ATAU, Anda dapat menggunakan model dispersi / campuran, yang secara alami mengarah pada menafsirkan parameter sebagai variabel acak (alias statistik Bayesian) atau Anda dapat menghitung kemungkinan profil / kondisional / marjinal di bawah kerangka kerja kemungkinan. Either way, Anda telah meninggalkan harapan untuk datang dengan kemungkinan dibenarkan secara objektif,
Semoga ini membantu.
sumber
Dari perspektif teoritis, Pertanyaan 2 dan 3 didasarkan pada asumsi yang salah bahwa definisi tersebut salah. Jadi saya setuju dengan jawaban @ whuber dalam hal itu, dan jawaban @ whuber untuk pertanyaan 1 tidak memerlukan input tambahan dari saya.
Namun, dari perspektif yang lebih praktis, interval kepercayaan dapat diberikan definisi intuitifnya (Kemungkinan mengandung nilai sebenarnya) ketika secara numerik identik dengan interval kredibel Bayesian berdasarkan informasi yang sama (mis., Sebelumnya non-informatif).
Tapi ini agak mengecewakan bagi die-bayesian yang keras, karena untuk memverifikasi persyaratan untuk memberikan CInya interpretasi yang dia ingin berikan, mereka harus bekerja di luar solusi Bayesian, di mana interpretasi intuitif otomatis berlaku!
Contoh yang paling mudah adalah interval kepercayaan untuk mean normal dengan varians dikenal ¯ x ± σ Z α / 2 , dan1 - α x¯¯¯± σZα / 2 selang kredibel posterior ¯ x ± σ Z α / 2 .1 - α x¯¯¯± σZα / 2
Saya tidak begitu yakin dengan kondisinya, tetapi saya tahu hal-hal berikut ini penting bagi interpretasi intisari dari CI yang berlaku:
1) ada statistik Pivot, yang distribusinya tidak tergantung pada parameter (apakah pivot yang tepat ada di luar distribusi normal dan chi-square?)
2) tidak ada parameter gangguan, (kecuali dalam kasus statistik Pivotal, yang merupakan salah satu dari beberapa cara yang tepat seseorang harus menangani parameter gangguan saat membuat CI)
3) ada statistik yang cukup untuk parameter yang diminati, dan interval kepercayaan menggunakan statistik yang cukup
4) distribusi sampling dari statistik yang cukup dan distribusi posterior memiliki semacam kesimetrisan antara statistik yang cukup dan parameternya. Dalam kasus normal distribusi sampling simetri dalam sementara(μ|¯x,( x¯¯¯| μ,σ) ∼ N( μ , σn√) ( μ | x¯¯¯, σ) ∼ N( x¯¯¯, σn√)
Kondisi-kondisi ini biasanya sulit ditemukan, dan biasanya lebih cepat untuk menentukan interval Bayesian, dan membandingkannya. Latihan yang menarik mungkin juga untuk mencoba dan menjawab pertanyaan "untuk apa sebelumnya CI saya juga interval yang kredibel?" Anda dapat menemukan beberapa asumsi tersembunyi tentang prosedur CI Anda dengan melihat ini sebelumnya.
sumber
Ini adalah hal yang mungkin sulit dipahami:
Interval kepercayaan berhubungan dengan prosedur pengambilan sampel. Jika Anda akan mengambil banyak sampel dan menghitung interval kepercayaan 95% untuk setiap sampel, Anda akan menemukan bahwa 95% interval tersebut mengandung rata-rata populasi.
Ini berguna misalnya untuk departemen kualitas industri. Orang-orang itu mengambil banyak sampel, dan sekarang mereka memiliki keyakinan bahwa sebagian besar perkiraan mereka akan cukup dekat dengan kenyataan. Mereka tahu bahwa 95% dari perkiraan mereka cukup bagus, tetapi mereka tidak dapat mengatakannya tentang masing-masing dan setiap perkiraan spesifik.
Demikian juga, jika Anda hanya memiliki 1 sampel (dengan demikian 1 interval kepercayaan), Anda tidak memiliki cara untuk mengatakan seberapa besar rata-rata populasi dalam interval tersebut. Mean (atau parameter apa pun) ada di dalamnya, atau tidak. Probabilitasnya adalah 1, atau 0.
Juga, itu tidak benar bahwa nilai-nilai dalam Interval Keyakinan lebih mungkin daripada nilai-nilai di luar itu. Saya membuat ilustrasi kecil; semuanya diukur dalam ° C. Ingat, air membeku pada suhu 0 ° C dan mendidih pada suhu 100 ° C.
Kasing: di danau yang dingin, kami ingin memperkirakan suhu air yang mengalir di bawah es. Kami mengukur suhu di 100 lokasi. Ini data saya:
Suhu di dalam interval kepercayaan ini jelas TIDAK lebih mungkin daripada suhu di luarnya. Suhu rata-rata air yang mengalir di danau ini TIDAK DAPAT lebih dingin dari 0 ° C, jika tidak maka bukan air melainkan es. Sebagian dari interval kepercayaan ini (yaitu, bagian dari -0,8 hingga 0) sebenarnya memiliki probabilitas 0% berisi parameter sebenarnya.
Kesimpulannya: interval kepercayaan adalah konsep yang sering terjadi, dan karena itu didasarkan pada ide sampel berulang. Jika banyak peneliti akan mengambil sampel dari danau ini, dan jika semua peneliti akan menghitung interval kepercayaan, maka 95% dari interval tersebut akan mengandung parameter sebenarnya. Tetapi untuk satu interval kepercayaan tunggal tidak mungkin untuk mengatakan seberapa besar kemungkinannya mengandung parameter yang benar.
sumber
Oke, saya menyadari bahwa ketika Anda menghitung interval kepercayaan 95% untuk parameter menggunakan metode frequentist klasik, itu tidak berarti bahwa ada kemungkinan 95% bahwa parameter berada dalam interval itu. Namun ... ketika Anda mendekati masalah dari perspektif Bayesian, dan menghitung interval kredibel 95% untuk parameter, Anda mendapatkan (dengan asumsi sebelumnya tidak informatif) persis interval yang sama yang Anda dapatkan menggunakan pendekatan klasik. Jadi, jika saya menggunakan statistik klasik untuk menghitung interval kepercayaan 95% untuk (katakanlah) mean dari kumpulan data, maka adalah benar bahwa ada kemungkinan 95% bahwa parameter terletak pada interval tersebut.
sumber
Anda bertanya tentang interval kepercayaan Frequentist . Definisi (perhatikan bahwa tidak ada 2 kutipan Anda yang merupakan definisi! Pernyataan yang adil, yang keduanya benar) adalah:
Jadi, Anda memiliki model (dibuat menggunakan data yang diamati) dan perkiraan parameternya. Kemudian jika Anda membuat beberapa set data hipotetis sesuai dengan model dan parameter ini, estimasi parameter akan berada dalam interval kepercayaan.
Jadi pada kenyataannya, pendekatan kerap kali ini mengambil model dan perkiraan parameter sebagai tetap, seperti yang diberikan, dan memperlakukan data Anda sebagai tidak pasti - sebagai sampel acak dari banyak data lain yang mungkin.
Ini benar-benar sulit untuk ditafsirkan dan ini sering digunakan sebagai argumen untuk statistik Bayesian ( yang saya pikir kadang-kadang sedikit dapat diperdebatkan . Statistik bayesian di sisi lain mengambil data Anda sebagai tetap dan memperlakukan parameter sebagai tidak pasti. Interval kredibilitas bayesian adalah kemudian benar-benar intuitif, seperti yang Anda harapkan: interval kredibel bayesian adalah interval di mana dengan 95% nilai parameter sebenarnya terletak.
Namun dalam praktiknya banyak orang menafsirkan interval kepercayaan yang sering terjadi dengan cara yang sama seperti interval kredibel Bayesian dan banyak ahli statistik tidak menganggap ini sebagai masalah besar - meskipun mereka semua tahu, itu tidak 100% benar. Juga dalam praktiknya, interval kepercayaan / kredibilitas bayesian yang sering dan sering tidak akan banyak berbeda, ketika menggunakan bayesian uninformative priors .
sumber
Tetapi dalam statistik frequentist, tidak ada yang sebelumnya dan dengan demikian sesuatu sepertiP( Q ∈ . . . | T∈ . . . ) θ θ ∈ [ T- 1 ; T+ 1 ] 0,95 ∀ θ , P( θ ∈ [ T- 1 ; T+ 1 ] | θ ) = 0,95
Jadi:
Pernyataan Bayesian lebih alami. Paling sering, pernyataan frequentist disalahartikan secara spontan sebagai pernyataan Bayesian (oleh otak manusia normal yang tidak pernah mempraktikkan statistik selama bertahun-tahun). Dan jujur, banyak buku statistik tidak menjelaskan hal itu.
Dan praktis?
Dalam banyak situasi yang biasa, faktanya adalah bahwa probabilitas yang diperoleh dengan pendekatan frequentist dan Bayesian sangat dekat. Sehingga membingungkan pernyataan sering untuk satu Bayesian memiliki konsekuensi kecil. Tetapi "secara filosofis" sangat berbeda.
sumber