Apa, tepatnya, interval kepercayaan?

86

Saya tahu secara kasar dan tidak resmi apa itu interval kepercayaan diri. Namun, sepertinya saya tidak bisa membungkus kepala saya di sekitar satu detail yang agak penting: Menurut Wikipedia:

Interval kepercayaan tidak memprediksi bahwa nilai sebenarnya dari parameter memiliki probabilitas tertentu berada dalam interval kepercayaan mengingat data benar-benar diperoleh.

Saya juga melihat poin serupa yang dibuat di beberapa tempat di situs ini. Definisi yang lebih benar, juga dari Wikipedia, adalah:

jika interval kepercayaan dibangun di banyak analisis data terpisah dari percobaan yang diulang (dan mungkin berbeda), proporsi interval tersebut yang mengandung nilai sebenarnya dari parameter akan mendekati tingkat kepercayaan

Sekali lagi, saya telah melihat poin serupa dibuat di beberapa tempat di situs ini. Saya tidak mengerti. Jika, di bawah eksperimen berulang, fraksi interval kepercayaan yang dihitung yang berisi parameter sebenarnya θ adalah , lalu bagaimana probabilitas bahwa dalam interval kepercayaan yang dihitung untuk percobaan sebenarnya adalah selain dari ? Saya mencari yang berikut dalam sebuah jawaban:θ ( 1 - α )(1α)θ(1α)

  1. Klarifikasi perbedaan antara definisi yang salah dan benar di atas.

  2. Definisi formal dan tepat dari interval kepercayaan yang dengan jelas menunjukkan mengapa definisi pertama salah.

  3. Contoh nyata dari kasus di mana definisi pertama salah secara spektakuler, bahkan jika model yang mendasarinya benar.

dsimcha
sumber
4
Posting ini memiliki beberapa diskusi yang bagus tentang masalah interval kepercayaan stats.stackexchange.com/questions/2356/… . Artikel yang dimaksud dalam posting, saya pikir, membantu menjelaskan secara tepat mengapa definisi di atas tepat untuk interval kepercayaan. Seringkali ketika melihat bagaimana CI rusak, orang dapat memahaminya dengan lebih baik.
probabilityislogic
2
Sebagian diriku memuji pertanyaan itu (+1). Bagian yang bersaing ingin menunjukkan bahwa 1. Mayoritas besar konsumen statistik, orang-orang yang menggunakan statistik secara pragmatis tetapi tidak secara filosofis untuk menunjukkan pendapat mereka dalam bidang kimia atau riset pasar, tidak akan pernah memahami masalah-masalah tersebut, dan kita akan sering bingung untuk menjelaskan hasil. 2. Bahkan beberapa ahli statistik purist dapat jatuh ke dalam perangkap membuat pernyataan yang diduga probabilistik seperti yang melibatkan interval kepercayaan ketika mereka tidak bekerja dengan sampel acak. Masalah yang jauh lebih besar.
rolando2
3
@ Mario Asumsi Anda tidak benar! Dari 100 pengulangan percobaan, kami berharap 95 dari CI (bukan berarti) mengandung mean yang sebenarnya (tetapi tidak diketahui). CI adalah acak tetapi rata-rata populasi sebenarnya tidak.
whuber
6
Ada sebuah makalah yang bagus oleh Cumming & Maillardet (2006) yang menunjukkan bahwa tidak 95% dari replikasi berarti akan jatuh ke CI asli, tetapi hanya 83,4% (mereka menyebut nilai ini 'persentase tangkapan'). Alasannya adalah bahwa ada dua sumber variabilitas: A) variabilitas dari mean asli sekitar mu, dan, B) variabilitas berarti replikasi sekitar mu. Kebanyakan orang lupa A: CI asli tidak perlu dibangun di sekitar mu!
Felix S
2
Pembaca yang tertarik mungkin juga ingin melihat utas ini: Mengapa 95% CI tidak menyiratkan kemungkinan 95% mengandung mean?
gung - Reinstate Monica

Jawaban:

26

Saya menemukan eksperimen pikiran ini bermanfaat ketika memikirkan interval kepercayaan. Itu juga menjawab pertanyaan Anda 3.

Misalkan dan Y = X + a - 1XU(0,1) . Pertimbangkan dua pengamatanYmengambil nilai-nilaiy1dany2sesuai dengan pengamatanx1danx2dariX, dan biarkanyl=min(y1,y2)danyu=max(y1,y2). Maka[yl,yu]adalah interval kepercayaan 50% untukaY=X+Sebuah-12Yy1y2x1x2Xyl=min(y1,y2)ykamu=maks(y1,y2)[yl,ykamu]Sebuah(karena interval menyertakan jika x 1 < 1Sebuahataux1>1x1<12<x2, yang masing-masing memiliki probabilitas1x1>12>x2 ).14

Namun, jika maka kita tahu bahwa probabilitas bahwa interval berisiaadalah1, bukan1ykamu-yl>12Sebuah1 . Kehalusannya adalah bahwainterval kepercayaanz%untuk suatu parameter berarti bahwa titik akhir interval (yang merupakan variabel acak) terletak di kedua sisi parameter dengan probabilitasz%sebelum Anda menghitung interval, bukan berarti probabilitas parameter berada di dalam Intervalnya adalahz%setelah Anda menghitung intervalnya.12z%z% z%

Chris Taylor
sumber
3
Perhatikan bahwa hampir pasti, maka interval [ y l , y u ] berisi parameter a dengan probabilitas nol. Bahkan argumen Anda bekerja jika apa yang Anda memperkirakan adalah θ = a + 1Y>Sebuah[yl,ykamu]Sebuah . θ=Sebuah+12
Apakah
4
Saya tidak berpikir contoh counter ini adalah valid, karena Anda hanya tahu probabilitas bahwa interval mengandung adalah salah satu setelah melihat bahwa y u - y l > 1 / 2 . Sangat masuk akal bahwa probabilitas akan berubah setelah kami memperoleh informasi tambahan. Jika yang Anda tahu adalah bahwa intervalnya adalah interval kepercayaan 50%, maka kemungkinannya masih 1/2 (walaupun itu kemungkinan Bayesian bukan yang sering terjadi karena berlaku untuk peristiwa tertentu yang tidak memiliki frekuensi jangka panjang)θykamu-yl>1/2
Dikran Marsupial
1
Itu memang contoh yang baik, tetapi saya sangat tidak setuju dengan pernyataan Anda tentang probabilitas yang entah bagaimana berubah sebelum dan sesudah menghitung interval kepercayaan. Itu tidak masuk akal, dan memberi kesan bahwa matematika entah bagaimana peduli tentang apa yang Anda ketahui dan apa yang tidak. Tidak !! Anda selalu memiliki adalah 1P(Sebuah[yl,ykamu]) . Anda jugaselalumemilikiP itu(a[yl,yu]12adalah1. Itu bukan kontradiksi, yang satu hanya probabilitas tanpa syarat dan yang lain adalah probabilitas bersyarat. P(Sebuah[yl,ykamu]|ykamu-yl>12)1
fgp
2
@ fgp, ya, mungkin itu kata-kata yang buruk di pihak Taylor yang berbicara tentang probabilitas yang berubah. Tidak ada probabilitas yang berubah. Apa yang diperlihatkan oleh argumen tersebut adalah bagaimana mudahnya situasi muncul yang menunjukkan pemahaman yang salah tentang CI menyebabkan masalah logis. Jika Anda percaya CI yang Anda amati memiliki kemungkinan 50% benar, tetapi itu tidak mungkin benar, maka Anda memahami bahwa CI salah.
John
36

Ada banyak masalah tentang interval kepercayaan, tetapi mari kita fokus pada kutipan. Masalahnya terletak pada kemungkinan salah tafsir alih-alih masalah kebenaran. Ketika orang mengatakan "parameter memiliki probabilitas tertentu" sesuatu, mereka memikirkan parameter sebagai variabel acak. Ini bukan sudut pandang prosedur interval kepercayaan (klasik), yang variabel acaknya adalah interval itu sendiri dan parameternya ditentukan, bukan acak, namun tidak diketahui. Inilah sebabnya mengapa pernyataan seperti itu sering diserang.

Secara matematis, jika kita membiarkan prosedur apa pun yang memetakan data x = ( x i ) ke himpunan bagian dari ruang parameter dan jika (tidak peduli apa nilai dari parameter θ mungkin) pernyataan θ t ( x ) mendefinisikan suatu peristiwa A ( x ) , maka - menurut definisi - memiliki probabilitas Pr θ ( A ( x ) ) untuk setiap nilai yang mungkin dari θ . Ketika t adalah prosedur interval kepercayaan dengan keyakinan 1 -tx=(xsaya)θθt(x)SEBUAH(x)Prθ(SEBUAH(x))θt maka probabilitas ini seharusnya memiliki nilai maksimum (di atas semua nilai parameter) 1 - α . (Tunduk pada kriteria ini, kami biasanya memilih prosedur yang mengoptimalkan beberapa properti tambahan, seperti menghasilkan interval kepercayaan pendek atau simetris, tapi itu masalah terpisah.) Hukum Lemah Angka Besar kemudian membenarkan kutipan kedua. Namun, itu bukan definisi interval kepercayaan: itu hanya properti yang mereka miliki.1-α1-α

Saya pikir analisis ini telah menjawab pertanyaan 1, menunjukkan bahwa premis pertanyaan 2 salah, dan membuat pertanyaan 3 dapat diperdebatkan.

whuber
sumber
3
Terima kasih telah memberikan jawaban untuk pertanyaan yang sangat bagus. Bolehkah saya mengemukakan analogi berikut untuk diskusi lebih lanjut? Misalkan saya melempar koin yang adil berulang kali. Kemudian, . Sekarang, saya melempar koin sekali, tetapi tidak menunjukkan kepada Anda apa yang saya membalikkan, dan saya bertanya: "Berapa kemungkinan kepala naik?". Bagaimana Anda menjawab pertanyaan itu? P(HeSebuahd)=.50
Wolfgang
3
Cara lain untuk mengungkapkannya: untuk orang-orang non-Bayesia, satu-satunya "hal" yang dapat memiliki kemungkinan adalah peristiwa yang mungkin - dalam arti hasil di masa depan dari eksperimen acak. Mengingat bahwa parameter memiliki nilai true tetap, setelah Anda memiliki interval dengan nilai-nilai tertentu, itu bukan peristiwa yang mungkin lagi apakah parameter termasuk dalam interval atau tidak. Sebagai hasilnya, Anda dapat memiliki kepercayaan diri dalam proses yang menghasilkan interval, tetapi tidak dalam dua angka tertentu.
caracal
1
@caracal - hanya beberapa makanan untuk dipikirkan, apakah "koin balik" setiap benar-benar "acak"? Jika Anda mengatakan "ya" maka Anda akan menolak gagasan bahwa apakah koin muncul kepala adalah fungsi deterministik (tetapi rumit) dari banyak hal (katakanlah angin, ketinggian, kekuatan dan sudut flip, berat koin, dll. .). Saya pikir ini menunjukkan standar ganda "keacakan" yang berlaku untuk pemikiran berbasis CI, data tetap tetapi kami tidak yakin tentang nilainya ( data ergo acak ), sementara parameternya tetap tetapi kami tidak yakin tentang nilainya ( parameter ergo tidak acak ).
probabilityislogic
4
@ Wolfgang Saya tidak melihat bagaimana contoh Anda berkaitan dengan interval kepercayaan. Anda tidak meminta apa pun yang terkait dengan parameter distribusi. Situasi Anda paling erat kaitannya dengan interval prediksi. Saya pikir seluruh diskusi ini mungkin memiliki minat dalam konteks itu, tetapi tidak termasuk dalam utas tentang interval kepercayaan.
whuber
2
@whuber Pertanyaan apakah seseorang dapat membuat pernyataan probabilitas tentang 95% CI tertentu yang menangkap parameter benar tidak diketahui sangat mirip dengan pertanyaan apakah seseorang dapat membuat pernyataan probabilitas tentang flip tertentu di mana hasilnya masih belum diketahui. Dalam jangka panjang, 95% CI akan menangkap parameter. Dalam jangka panjang, 50% dari flips adalah head. Bisakah kita mengatakan bahwa ada kemungkinan 95% bahwa CI tertentu menangkap parameter? Bisakah kita mengatakan bahwa ada kemungkinan 50% bahwa kepala sudah bangun sebelum melihat? Saya akan mengatakan ya untuk keduanya. Tetapi beberapa orang mungkin tidak setuju.
Wolfgang
19

Saya tidak akan menyebut definisi CI sebagai salah, tetapi mereka mudah untuk diartikan salah, karena ada lebih dari satu definisi probabilitas. CI didasarkan pada definisi Probabilitas (Frequentist atau ontologis) berikut ini

(1) probabilitas suatu proposisi = proporsi jangka panjang dari waktu yang proposisi itu amati benar, tergantung pada proses menghasilkan data

Dengan demikian, agar valid secara konseptual dalam menggunakan CI, Anda harus menerima definisi probabilitas ini. Jika tidak, maka interval Anda bukan CI, dari sudut pandang teoretis.

Inilah sebabnya mengapa definisi menggunakan proporsi kata dan BUKAN kata probabilitas , untuk memperjelas bahwa definisi "frekuensi jangka panjang" probabilitas digunakan.

Definisi alternatif utama Probabilitas (Epistemologis atau probabilitas sebagai perpanjangan Logika deduktif atau Bayesian) adalah

(2) probabilitas suatu proposisi = tingkat kepercayaan rasional bahwa proposisi itu benar, tergantung pada kondisi pengetahuan

Orang sering kali secara intuisi menggabungkan kedua definisi ini, dan menggunakan interpretasi mana pun yang terjadi untuk menarik intuisi mereka. Ini dapat membawa Anda ke semua jenis situasi yang membingungkan (terutama ketika Anda berpindah dari satu paradigma ke paradigma lain).

Bahwa kedua pendekatan tersebut sering mengarah pada hasil yang sama, artinya dalam beberapa kasus kami memiliki:

tingkat kepercayaan rasional bahwa proposisi itu benar, tergantung pada kondisi pengetahuan = proporsi jangka panjang dari proposisi yang diamati benar, tergantung pada proses menghasilkan data

Intinya adalah bahwa ia tidak berlaku secara universal , jadi kita tidak dapat mengharapkan dua definisi yang berbeda untuk selalu mengarah pada hasil yang sama. Jadi, kecuali jika Anda benar-benar menemukan solusi Bayesian, dan kemudian menemukan itu menjadi interval yang sama, Anda tidak dapat memberikan interval yang diberikan oleh CI interpretasi sebagai kemungkinan mengandung nilai sebenarnya. Dan jika Anda melakukannya, maka intervalnya bukan Interval Keyakinan, tetapi Interval yang Dapat Dipercaya.

probabilityislogic
sumber
2
Saya tidak melihat mengapa probabilitas suatu proposisi menurut definisi 1 harus berupa bilangan rasional. Proporsi jangka panjang tampaknya merujuk pada batas proporsi kali sedemikian sehingga proposisi tersebut diamati benar. Setiap proporsi adalah angka rasional tetapi batasnya mungkin tidak. (Untungnya, tanda kurung Anda ini tampaknya tangensial paling baik untuk sisa jawaban Anda.)
Apakah
3
@probability Jawaban ini sepertinya membawa kita pada garis singgung dengan cara yang tidak terlalu konstruktif. Menyamakan probabilitas dan proporsi adalah bentuk kebingungan ontologis, mirip dengan menyamakan suhu dengan tingkat merkuri dalam termometer: satu adalah konstruksi teoretis dan yang lainnya adalah fenomena fisik yang digunakan untuk mengukurnya. Ada beberapa diskusi tentang ini di stats.stackexchange.com/questions/1525/… .
whuber
@Dier - Anda benar, sebenarnya urutan , yang merupakan istilah rasional dengan batas irasional. Saya telah menghapus komentar ini. Terima kasih telah membahas ini. xn=r2xn-1+xn-12r
probabilityislogic
6
@whuber - Poin ini relevan untuk diangkat karena kesalahpahaman inilah yang membuat orang menafsirkan CI dengan cara yang salah. Probabilitas yang membingungkan dengan "tingkat kepercayaan rasional" tidak konsisten dengan paradigma frequentist. Inilah yang terjadi ketika Anda mengambil CI berarti "probabilitas nilai benar berada dalam interval", yang adalah apa yang dilakukan @dsimcha dalam pertanyaan.
probabilityislogic
1
@probability Terima kasih atas penjelasannya. Saya memahami balasan Anda sesuai dengan definisi "probabilitas = proporsi." Faktanya, membaca ulang dengan seksama masih menunjukkan ini adalah apa yang Anda katakan di paragraf ketiga, meskipun komentar Anda sekarang mencirikan ini sebagai kesalahpahaman. Anda mungkin ingin memperjelas hal ini.
whuber
6

RA Fisher memiliki kriteria untuk kegunaan interval kepercayaan: CI harus tidak mengakui "himpunan bagian yang dapat diidentifikasi" yang menyiratkan tingkat kepercayaan yang berbeda. Dalam sebagian besar (jika tidak semua) contoh tandingan, kami memiliki kasus di mana ada himpunan bagian yang dapat diidentifikasi yang memiliki probabilitas cakupan yang berbeda.

Dalam kasus ini, Anda bisa menggunakan interval kredit Bayesian untuk menentukan pengertian subjektif di mana parameter berada, atau Anda dapat merumuskan interval kemungkinan untuk mencerminkan ketidakpastian relatif dalam parameter, mengingat data.

Sebagai contoh, satu kasus yang tampaknya relatif bebas kontradiksi adalah interval kepercayaan normal 2 sisi untuk rata-rata populasi. Dengan asumsi pengambilan sampel dari populasi normal dengan std. Yang diberikan, CI 95% mengakui tidak ada himpunan bagian yang dapat diidentifikasi yang akan memberikan informasi lebih lanjut tentang parameter. Ini dapat dilihat oleh fakta bahwa rata-rata sampel adalah statistik yang cukup dalam fungsi kemungkinan - yaitu, fungsi kemungkinan independen dari nilai-nilai sampel individu setelah kita tahu rata-rata sampel.

Alasan kami memiliki kepercayaan subyektif dalam CI simetris 95% untuk rata-rata normal lebih sedikit dari probabilitas cakupan yang dinyatakan dan lebih dari fakta bahwa 95% CI simetris untuk rata-rata normal adalah interval "kemungkinan tertinggi", yaitu, semua nilai parameter dalam interval memiliki kemungkinan lebih tinggi daripada nilai parameter di luar interval. Namun, karena kemungkinan bukan probabilitas (dalam arti akurasi jangka panjang), itu lebih merupakan kriteria subyektif (seperti penggunaan sebelumnya dan kemungkinan Bayesian). Singkatnya, ada banyak interval tak berhingga untuk mean normal yang memiliki probabilitas cakupan 95%, tetapi hanya CI simetris yang memiliki plausbilti intuitif yang kita harapkan dari perkiraan interval.

Oleh karena itu, kriteria RA Fisher menyiratkan bahwa probabilitas cakupan harus sama dengan kepercayaan subyektif hanya jika mengakui tidak ada dari himpunan bagian yang dapat diidentifikasi. Jika himpunan bagian hadir, maka probabilitas cakupan akan tergantung pada nilai sebenarnya dari parameter yang menggambarkan himpunan bagian. Untuk mendapatkan interval dengan tingkat kepercayaan intuitif, Anda perlu mengkondisikan interval interval pada statistik tambahan yang sesuai yang membantu mengidentifikasi subset. ATAU, Anda dapat menggunakan model dispersi / campuran, yang secara alami mengarah pada menafsirkan parameter sebagai variabel acak (alias statistik Bayesian) atau Anda dapat menghitung kemungkinan profil / kondisional / marjinal di bawah kerangka kerja kemungkinan. Either way, Anda telah meninggalkan harapan untuk datang dengan kemungkinan dibenarkan secara objektif,

Semoga ini membantu.

kst
sumber
1
(+1) Salah satu cara untuk membenarkan Normal CI simetris adalah meminimalkan panjang yang diharapkan. Pada akhirnya itu hanya mendorong kembali subjektivitas ke pilihan panjang sebagai fungsi kerugian dalam prosedur pengambilan keputusan: tapi itu bisa dibilang jenis subjektivitas yang "baik" (karena itu mengekspos peran tujuan analitis kami dalam pilihan prosedur statistik kami) daripada subjektivitas "buruk", yang terdengar hanya seperti julukan yang merendahkan.
whuber
5

Dari perspektif teoritis, Pertanyaan 2 dan 3 didasarkan pada asumsi yang salah bahwa definisi tersebut salah. Jadi saya setuju dengan jawaban @ whuber dalam hal itu, dan jawaban @ whuber untuk pertanyaan 1 tidak memerlukan input tambahan dari saya.

Namun, dari perspektif yang lebih praktis, interval kepercayaan dapat diberikan definisi intuitifnya (Kemungkinan mengandung nilai sebenarnya) ketika secara numerik identik dengan interval kredibel Bayesian berdasarkan informasi yang sama (mis., Sebelumnya non-informatif).

Tapi ini agak mengecewakan bagi die-bayesian yang keras, karena untuk memverifikasi persyaratan untuk memberikan CInya interpretasi yang dia ingin berikan, mereka harus bekerja di luar solusi Bayesian, di mana interpretasi intuitif otomatis berlaku!

Contoh yang paling mudah adalah interval kepercayaan untuk mean normal dengan varians dikenal ¯ x ± σ Z α / 2 , dan1-αx¯±σZα/2 selang kredibel posterior ¯ x ± σ Z α / 2 .1-αx¯±σZα/2

Saya tidak begitu yakin dengan kondisinya, tetapi saya tahu hal-hal berikut ini penting bagi interpretasi intisari dari CI yang berlaku:

1) ada statistik Pivot, yang distribusinya tidak tergantung pada parameter (apakah pivot yang tepat ada di luar distribusi normal dan chi-square?)

2) tidak ada parameter gangguan, (kecuali dalam kasus statistik Pivotal, yang merupakan salah satu dari beberapa cara yang tepat seseorang harus menangani parameter gangguan saat membuat CI)

3) ada statistik yang cukup untuk parameter yang diminati, dan interval kepercayaan menggunakan statistik yang cukup

4) distribusi sampling dari statistik yang cukup dan distribusi posterior memiliki semacam kesimetrisan antara statistik yang cukup dan parameternya. Dalam kasus normal distribusi sampling simetri dalam sementara(μ|¯x,(x¯|μ,σ)N(μ,σn)(μ|x¯,σ)N(x¯,σn)

Kondisi-kondisi ini biasanya sulit ditemukan, dan biasanya lebih cepat untuk menentukan interval Bayesian, dan membandingkannya. Latihan yang menarik mungkin juga untuk mencoba dan menjawab pertanyaan "untuk apa sebelumnya CI saya juga interval yang kredibel?" Anda dapat menemukan beberapa asumsi tersembunyi tentang prosedur CI Anda dengan melihat ini sebelumnya.

probabilityislogic
sumber
1
(+1) Apakah benar ada orang seperti "anti-Bayesian"? :-)
whuber
6
@whuber Ini satu . Dan inilah seorang ahli ekonometrika yang bekerja sama dengannya dalam beasiswa dalam filsafat statistik.
Cyan
1
Terima kasih! Itu thread yang sangat menarik dalam filosofi probabilitas dan statistik yang saya tidak sadari.
whuber
1
x¯±zα/2σnn
3

Ini adalah hal yang mungkin sulit dipahami:

  • jika rata-rata 95% dari semua interval kepercayaan akan berisi parameter
  • dan saya memiliki satu interval kepercayaan khusus
  • mengapa probabilitas interval ini tidak mengandung parameter juga 95%?

Interval kepercayaan berhubungan dengan prosedur pengambilan sampel. Jika Anda akan mengambil banyak sampel dan menghitung interval kepercayaan 95% untuk setiap sampel, Anda akan menemukan bahwa 95% interval tersebut mengandung rata-rata populasi.

Ini berguna misalnya untuk departemen kualitas industri. Orang-orang itu mengambil banyak sampel, dan sekarang mereka memiliki keyakinan bahwa sebagian besar perkiraan mereka akan cukup dekat dengan kenyataan. Mereka tahu bahwa 95% dari perkiraan mereka cukup bagus, tetapi mereka tidak dapat mengatakannya tentang masing-masing dan setiap perkiraan spesifik.

16

16

16

Demikian juga, jika Anda hanya memiliki 1 sampel (dengan demikian 1 interval kepercayaan), Anda tidak memiliki cara untuk mengatakan seberapa besar rata-rata populasi dalam interval tersebut. Mean (atau parameter apa pun) ada di dalamnya, atau tidak. Probabilitasnya adalah 1, atau 0.

Juga, itu tidak benar bahwa nilai-nilai dalam Interval Keyakinan lebih mungkin daripada nilai-nilai di luar itu. Saya membuat ilustrasi kecil; semuanya diukur dalam ° C. Ingat, air membeku pada suhu 0 ° C dan mendidih pada suhu 100 ° C.

Kasing: di danau yang dingin, kami ingin memperkirakan suhu air yang mengalir di bawah es. Kami mengukur suhu di 100 lokasi. Ini data saya:

  • 0,1 ° C (diukur di 49 lokasi);
  • 0,2 ° C (juga di 49 lokasi);
  • 0 ° C (. Di 1 lokasi ini adalah air hanya sekitar untuk membekukan);
  • 95 ° C (di satu lokasi, ada pabrik yang secara ilegal membuang air yang sangat panas ke danau).
  • Suhu rata-rata: 1.1 ° C;
  • Simpangan baku: 1,5 ° C;
  • 95% -CI: (-0,8 ° C ...... + 3.0 ° C).

Suhu di dalam interval kepercayaan ini jelas TIDAK lebih mungkin daripada suhu di luarnya. Suhu rata-rata air yang mengalir di danau ini TIDAK DAPAT lebih dingin dari 0 ° C, jika tidak maka bukan air melainkan es. Sebagian dari interval kepercayaan ini (yaitu, bagian dari -0,8 hingga 0) sebenarnya memiliki probabilitas 0% berisi parameter sebenarnya.

Kesimpulannya: interval kepercayaan adalah konsep yang sering terjadi, dan karena itu didasarkan pada ide sampel berulang. Jika banyak peneliti akan mengambil sampel dari danau ini, dan jika semua peneliti akan menghitung interval kepercayaan, maka 95% dari interval tersebut akan mengandung parameter sebenarnya. Tetapi untuk satu interval kepercayaan tunggal tidak mungkin untuk mengatakan seberapa besar kemungkinannya mengandung parameter yang benar.

Pieter Hogendoorn
sumber
1
Jangan bingung fakta bahwa statistik frequentist tidak mengukur kepercayaan dengan orang yang frequentist memiliki kepercayaan sebelumnya dan memperbaruinya. Perbedaannya bukanlah apakah frequentist adalah idiot tanpa pengetahuan di luar data tetapi apakah statistik frequentist memberikan langkah-langkah langsung dari negara keyakinan. Mereka yang sering harus memperbarui keyakinan mereka berdasarkan tes, CI, dll. Jika tidak seluruh sistem mereka bekerja karena semuanya tergantung pada keputusan yang diambil.
John
2

Oke, saya menyadari bahwa ketika Anda menghitung interval kepercayaan 95% untuk parameter menggunakan metode frequentist klasik, itu tidak berarti bahwa ada kemungkinan 95% bahwa parameter berada dalam interval itu. Namun ... ketika Anda mendekati masalah dari perspektif Bayesian, dan menghitung interval kredibel 95% untuk parameter, Anda mendapatkan (dengan asumsi sebelumnya tidak informatif) persis interval yang sama yang Anda dapatkan menggunakan pendekatan klasik. Jadi, jika saya menggunakan statistik klasik untuk menghitung interval kepercayaan 95% untuk (katakanlah) mean dari kumpulan data, maka adalah benar bahwa ada kemungkinan 95% bahwa parameter terletak pada interval tersebut.

Ringold
sumber
5
Apakah Anda mendapatkan hasil yang sama menggunakan interval kepercayaan yang sering dan interval kredibel Bayesian tergantung pada masalah, dan khususnya pada distribusi sebelumnya yang digunakan dalam pendekatan Bayesian. Penting juga dalam matematika dan sains bahwa ketika Anda benar, Anda benar karena alasan yang benar!
Dikran Marsupial
4
Jika Anda "menggunakan statistik klasik untuk menghitung interval kepercayaan 95% untuk [parameter]," maka, jika Anda berpikir secara konsisten, tidak ada artinya merujuk pada "probabilitas bahwa parameter terletak pada interval itu." Saat Anda menyebutkan probabilitas itu, Anda telah mengubah model statistik situasi Anda. Dalam model baru, di mana parameternya acak, tidak benar untuk menghitung CI menggunakan metode frequentist. Memperoleh jawaban yang benar dengan cara ini dalam beberapa situasi memang menarik tetapi tidak membenarkan kebingungan konseptual yang mendasari itu.
whuber
4
@whuber - premis Anda "... jika Anda beralasan secara konsisten ..." memiliki konsekuensi dari teorema Cox tua yang baik itu. Dikatakan bahwa jika Anda bernalar secara konsisten, maka solusi Anda harus secara matematis setara dengan Bayesian. Jadi, mengingat premis ini, CI tentu akan setara dengan interval yang kredibel, dan interpretasinya sebagai probabilitas adalah valid. Dan di Bayes, itu bukan parameter yang memiliki distribusi, itu adalah ketidakpastian tentang parameter yang memiliki distribusi.
probabilityislogic
2
... lanjutkan ... Jadi orang dapat memainkan permainan konyol aku seorang Bayesian "Prob parameter yang ada dalam interval", aku seorang "prob yang interval mencakup parameter", aku seorang Bayesian ..., Saya seorang frequentist, ..., Saya seorang Bayesian ..., Saya seorang frequentist, ..... semua angka perhitungan aktual tidak pernah berubah
probabilityislogic
2

Anda bertanya tentang interval kepercayaan Frequentist . Definisi (perhatikan bahwa tidak ada 2 kutipan Anda yang merupakan definisi! Pernyataan yang adil, yang keduanya benar) adalah:

Jika saya telah mengulangi percobaan ini beberapa kali, mengingat model yang sesuai dengan nilai parameter ini , dalam 95% percobaan nilai estimasi parameter akan jatuh dalam interval ini.

Jadi, Anda memiliki model (dibuat menggunakan data yang diamati) dan perkiraan parameternya. Kemudian jika Anda membuat beberapa set data hipotetis sesuai dengan model dan parameter ini, estimasi parameter akan berada dalam interval kepercayaan.

Jadi pada kenyataannya, pendekatan kerap kali ini mengambil model dan perkiraan parameter sebagai tetap, seperti yang diberikan, dan memperlakukan data Anda sebagai tidak pasti - sebagai sampel acak dari banyak data lain yang mungkin.

Ini benar-benar sulit untuk ditafsirkan dan ini sering digunakan sebagai argumen untuk statistik Bayesian ( yang saya pikir kadang-kadang sedikit dapat diperdebatkan . Statistik bayesian di sisi lain mengambil data Anda sebagai tetap dan memperlakukan parameter sebagai tidak pasti. Interval kredibilitas bayesian adalah kemudian benar-benar intuitif, seperti yang Anda harapkan: interval kredibel bayesian adalah interval di mana dengan 95% nilai parameter sebenarnya terletak.

Namun dalam praktiknya banyak orang menafsirkan interval kepercayaan yang sering terjadi dengan cara yang sama seperti interval kredibel Bayesian dan banyak ahli statistik tidak menganggap ini sebagai masalah besar - meskipun mereka semua tahu, itu tidak 100% benar. Juga dalam praktiknya, interval kepercayaan / kredibilitas bayesian yang sering dan sering tidak akan banyak berbeda, ketika menggunakan bayesian uninformative priors .

Ingin tahu
sumber
1-α1-α
@whuber, OK, saya ambil, tetapi jika Anda mengatakan definisi saya salah, silakan posting definisi lengkap Anda tentang apa itu CI.
Penasaran
Xt=[L.,U]ϕ(θ)θθ0γt(θ0)=Prθ0{L.(X)ϕ(θ0)U(X)}γ¯t=infθΩγt(θ)tt
@whuber, definisi Anda benar-benar tidak dapat dipahami untuk saya dan saya takut untuk kebanyakan orang juga :) Dan ya, maksud saya estimasi saat ini, karena sering mendapatkan estimasi parameter seperti yang diberikan dan data sebagai acak, kebalikan dari bayesian.
Penasaran
3
Saya pikir masalah utama dalam definisi Anda Curious adalah, "... perkiraan nilai parameter akan berada dalam interval." Ini bukan parameter yang diestimasi tetapi parameter tetap yang tidak diketahui; dan itu tidak termasuk dalam interval, melainkan interval bergerak dan 95% dari waktu menangkap parameter.
John
2

θTθθ[T-1;T+1]

T=12

T=12θ[11;13]P(θ[11;13]|T=12)

P(θ[11;13]|T=12)θT

  • θ[0;30]
  • T=12
  • P(θ[11;13]|T=12)=0,94

Tetapi dalam statistik frequentist, tidak ada yang sebelumnya dan dengan demikian sesuatu seperti P(θ...|T...)θθ[T-1;T+1]0,95θ,P(θ[T-1;T+1]|θ)=0,95

Jadi:

  • P(θ[T-1;T+1]|T)=0,94T=12
  • θ,P(θ[T-1;T+1]|θ)=0,95

Pernyataan Bayesian lebih alami. Paling sering, pernyataan frequentist disalahartikan secara spontan sebagai pernyataan Bayesian (oleh otak manusia normal yang tidak pernah mempraktikkan statistik selama bertahun-tahun). Dan jujur, banyak buku statistik tidak menjelaskan hal itu.

Dan praktis?

Dalam banyak situasi yang biasa, faktanya adalah bahwa probabilitas yang diperoleh dengan pendekatan frequentist dan Bayesian sangat dekat. Sehingga membingungkan pernyataan sering untuk satu Bayesian memiliki konsekuensi kecil. Tetapi "secara filosofis" sangat berbeda.

Benoit Sanchez
sumber