Tampaknya melalui berbagai pertanyaan terkait di sini, terdapat konsensus bahwa bagian "95%" dari apa yang kita sebut "interval kepercayaan 95%" mengacu pada fakta bahwa jika kita harus secara tepat mereplikasi prosedur pengambilan sampel dan perhitungan CI kita berkali-kali. , 95% dari CI yang dihitung demikian akan mengandung rata-rata populasi. Tampaknya juga merupakan konsensus bahwa definisi ini tidakizinkan seseorang untuk menyimpulkan dari CI 95% tunggal bahwa ada kemungkinan 95% bahwa rerata jatuh di suatu tempat dalam CI. Namun, saya tidak mengerti bagaimana yang pertama tidak menyiratkan yang terakhir sejauh, setelah membayangkan banyak CI 95% mengandung rata-rata populasi, seharusnya tidak menjadi ketidakpastian kita (berkenaan dengan apakah CI kami yang benar-benar dihitung mengandung populasi Berarti atau tidak) memaksa kita untuk menggunakan tingkat dasar dari kasus yang dibayangkan (95%) sebagai estimasi kami tentang probabilitas bahwa kasus kami yang sebenarnya mengandung CI?
Saya telah melihat tulisan berdebat di sepanjang baris "CI yang benar-benar dihitung baik mengandung mean populasi atau tidak, jadi probabilitasnya adalah 1 atau 0", tetapi ini tampaknya menyiratkan definisi aneh tentang probabilitas yang tergantung pada negara yang tidak dikenal (yaitu seorang teman membalik koin yang adil, menyembunyikan hasilnya, dan saya dilarang mengatakan ada kemungkinan 50% bahwa itu adalah kepala).
Tentunya saya salah, tapi saya tidak melihat di mana logika saya salah ...
sumber
Jawaban:
Sebagian dari masalah adalah bahwa definisi yang sering tentang probabilitas tidak memungkinkan probabilitas nontrivial untuk diterapkan pada hasil percobaan tertentu, tetapi hanya untuk beberapa populasi percobaan fiktif dari mana eksperimen khusus ini dapat dianggap sebagai sampel. Definisi CI membingungkan karena merupakan pernyataan tentang populasi eksperimen fiktif ini (biasanya), bukan tentang data tertentu yang dikumpulkan dalam contoh yang ada. Jadi bagian dari masalah adalah salah satu definisi probabilitas: Gagasan tentang nilai sebenarnya terletak dalam interval tertentu dengan probabilitas 95% tidak konsisten dengan kerangka kerja yang sering terjadi.
Aspek lain dari masalah ini adalah bahwa perhitungan kepercayaan sering tidak menggunakan semua informasi yang terkandung dalam sampel tertentu yang relevan untuk membatasi nilai sebenarnya dari statistik. Pertanyaan saya "Apakah ada contoh di mana interval kredibel Bayesian jelas lebih rendah daripada interval kepercayaan yang sering terjadi"membahas sebuah makalah oleh Edwin Jaynes yang memiliki beberapa contoh yang sangat bagus yang benar-benar menyoroti perbedaan antara interval kepercayaan dan interval kredibel. Salah satu yang sangat relevan dengan diskusi ini adalah Contoh 5, yang membahas perbedaan antara interval kredibel dan kepercayaan untuk memperkirakan parameter distribusi eksponensial terpotong (untuk masalah dalam kontrol kualitas industri). Dalam contoh yang dia berikan, ada cukup informasi dalam sampel untuk memastikan bahwa nilai sebenarnya dari parameter tidak terletak pada interval kepercayaan 90% yang dibangun dengan benar!
Ini mungkin tampak mengejutkan bagi sebagian orang, tetapi alasan untuk hasil ini adalah bahwa interval kepercayaan dan interval yang kredibel adalah jawaban untuk dua pertanyaan yang berbeda, dari dua interpretasi probabilitas yang berbeda.
Interval kepercayaan adalah jawaban untuk permintaan: "Beri saya interval yang akan mengurung nilai sebenarnya dari parameter dalam % dari contoh percobaan yang diulang banyak kali." Interval yang kredibel adalah jawaban untuk permintaan: "Beri saya interval yang tanda kurung nilai sebenarnya dengan probabilitas p diberikan sampel tertentu yang saya benar-benar amati. " Untuk dapat menjawab permintaan yang terakhir, kita harus terlebih dahulu mengadopsi salah satu (a ) konsep baru dari proses menghasilkan data atau (b) konsep yang berbeda dari definisi probabilitas itu sendiri.100p p
Alasan utama bahwa interval kepercayaan 95% tertentu tidak menyiratkan kemungkinan 95% untuk mengandung rerata adalah karena interval kepercayaan adalah jawaban untuk pertanyaan yang berbeda, jadi itu hanya jawaban yang tepat ketika jawaban kedua pertanyaan tersebut terjadi. memiliki solusi numerik yang sama.
Singkatnya, interval kredibel dan kepercayaan diri menjawab pertanyaan yang berbeda dari perspektif yang berbeda; keduanya bermanfaat, tetapi Anda harus memilih interval yang tepat untuk pertanyaan yang sebenarnya ingin Anda tanyakan. Jika Anda menginginkan interval yang menerima interpretasi probabilitas 95% (posterior) berisi nilai sebenarnya, maka pilih interval yang kredibel (dan, dengan itu, konseptualisasi probabilitas yang ada), bukan interval kepercayaan. Hal yang tidak boleh Anda lakukan adalah mengadopsi definisi probabilitas yang berbeda dalam interpretasi daripada yang digunakan dalam analisis.
Berkat @ cardinal untuk penyempurnaannya!
Ini adalah contoh nyata, dari buku hebat David MaKay, "Teori Informasi, Inferensi, dan Algoritma Pembelajaran" (halaman 464):
Biarkan parameter yang menarik menjadi dan data D , sepasang poin x 1 dan x 2 ditarik secara independen dari distribusi berikut:θ D x1 x2
Jika adalah 39 , maka kita akan mengharapkan untuk melihat dataset ( 39 , 39 ) , ( 39 , 40 ) , ( 40 , 39 ) dan ( 40 , 40 ) semua dengan sama probabilitas 1 / 4 . Pertimbangkan interval kepercayaan diriθ 39 (39,39) (39,40) (40,39) (40,40) 1/4
.[θmin(D),θmax(D)]=[min(x1,x2),max(x1,x2)]
Jelas ini adalah interval kepercayaan 75% yang valid karena jika Anda mengambil sampel ulang data, , berkali-kali maka interval kepercayaan yang dibangun dengan cara ini akan mengandung nilai sebenarnya 75% dari waktu.D=(x1,x2)
Sekarang perhatikan data . Dalam hal ini interval kepercayaan 75% yang sering terjadi adalah [ 29 , 29 ] . Namun, dengan asumsi model proses pembangkit sudah benar, θ bisa 28 atau 29 dalam kasus ini, dan kami tidak punya alasan untuk menganggap bahwa 29 lebih mungkin dari 28, sehingga probabilitas posterior adalah p ( θ = 28 | D ) = p ( θ = 29 | D ) = 1 / 2D=(29,29) [29,29] θ p(θ=28|D)=p(θ=29|D)=1/2 . Jadi dalam hal ini interval kepercayaan frequentist jelas bukan interval kredibel 75% karena hanya ada kemungkinan 50% bahwa itu berisi nilai sebenarnya dari , mengingat apa yang dapat kita simpulkan tentang θ dari sampel khusus ini .θ θ
Ya, ini adalah contoh yang dibuat-buat, tetapi jika interval kepercayaan dan interval yang kredibel tidak berbeda, maka mereka akan tetap identik dalam contoh yang dibuat.
Perhatikan perbedaan utama adalah bahwa interval kepercayaan adalah pernyataan tentang apa yang akan terjadi jika Anda mengulangi percobaan berkali-kali, interval yang dapat dipercaya adalah pernyataan tentang apa yang dapat disimpulkan dari sampel khusus ini.
sumber
Dalam statistik frequentist, probabilitas adalah tentang peristiwa dalam jangka panjang. Mereka hanya tidak berlaku untuk satu acara setelah selesai. Dan menjalankan percobaan dan perhitungan CI hanyalah peristiwa semacam itu.
Anda ingin membandingkannya dengan kemungkinan koin tersembunyi menjadi kepala tetapi Anda tidak bisa. Anda dapat menghubungkannya dengan sesuatu yang sangat dekat. Jika permainan Anda memiliki aturan di mana Anda harus menyatakan setelah flip "kepala" maka kemungkinan Anda akan benar dalam jangka panjang adalah 50% dan itu analog.
Ketika Anda menjalankan percobaan dan mengumpulkan data, maka Anda memiliki sesuatu yang mirip dengan flip koin yang sebenarnya. Proses percobaan seperti proses membalik koin yang menghasilkanμ atau tidak hanya seperti koin itu kepala atau tidak. Setelah Anda melempar koin, apakah Anda melihatnya atau tidak, tidak ada kemungkinan bahwa itu adalah kepala, itu kepala atau tidak. Sekarang anggaplah Anda memanggil kepala. Itulah yang menghitung CI. Karena Anda tidak pernah dapat mengungkapkan koin (analogi percobaan Anda akan hilang). Entah Anda benar atau salah, itu saja. Apakah kondisi saat ini ada kaitannya dengan kemungkinan muncul di flip berikutnya, atau bahwa saya bisa memprediksi apa itu? Tidak. Proses pembuatan kepala memiliki kemungkinan 0,5 menghasilkannya, tetapi itu tidak berarti bahwa kepala yang sudah ada memiliki kemungkinan 0,5 menjadi. Setelah Anda menghitung CI Anda, tidak ada kemungkinan bahwa ia menangkap μ Entah berhasil atau tidak — Anda sudah membalik koin.
OK, saya pikir saya sudah cukup menyiksanya. Poin kritisnya adalah analogi Anda salah arah. Anda tidak pernah dapat mengungkapkan koin; Anda hanya dapat memanggil kepala atau ekor berdasarkan asumsi tentang koin (percobaan). Anda mungkin ingin membuat taruhan setelah itu pada kepala atau ekor Anda dengan benar tetapi Anda tidak bisa menagihnya. Juga, ini merupakan komponen penting dari prosedur CI yang Anda nyatakan nilai impor dalam interval. Jika tidak, maka Anda tidak memiliki CI (atau setidaknya tidak satu pada% yang dinyatakan).
Mungkin hal yang membuat CI membingungkan adalah namanya. Ini adalah rentang nilai yang mengandung atau tidak mengandung . Kami pikir mereka mengandung μ tetapi kemungkinan itu tidak sama dengan proses yang dikembangkan untuk mengembangkannya. Bagian 95% dari nama CI 95% hanya tentang proses. Anda dapat menghitung rentang yang Anda yakini setelah itu mengandung μ pada tingkat probabilitas tetapi itu adalah perhitungan yang berbeda dan bukan CI.μ μ μ
Lebih baik untuk memikirkan nama 95% CI sebagai sebutan semacam pengukuran berbagai nilai yang menurut Anda masuk akal mengandung dan pisahkan 95% dari masuk akal itu. Kita bisa menyebutnya CI Jennifer sementara CI 99% adalah Wendy CI. Itu mungkin sebenarnya lebih baik. Kemudian, setelah itu kita dapat mengatakan bahwa kita percaya μ kemungkinan berada dalam kisaran nilai dan tidak ada yang akan terjebak mengatakan bahwa ada kemungkinan Wendy bahwa kita telah menangkap μ . Jika Anda ingin penunjukan yang berbeda, saya pikir Anda mungkin harus merasa bebas untuk menyingkirkan bagian "percaya diri" dari CI juga (tetapi ini adalah interval).μ μ μ
sumber
Ide-ide formal, eksplisit tentang argumen, kesimpulan dan logika berasal, dalam tradisi Barat, dengan Aristoteles. Aristoteles menulis tentang topik ini dalam beberapa karya yang berbeda (termasuk yang disebut Topik ;-)). Namun, prinsip tunggal yang paling mendasar adalah Hukum Non-kontradiksi , yang dapat ditemukan di berbagai tempat, termasuk Metafisikabuku IV, bab 3 & 4. Formulasi tipikal adalah: "... tidak mungkin untuk apa pun pada saat yang bersamaan dan tidak [dalam arti yang sama]" (1006 a 1). Pentingnya dinyatakan sedikit lebih awal, "... ini secara alami adalah titik awal bahkan untuk semua aksioma lainnya" (1005 b 30). Maafkan saya karena melakukan waxing filosofis, tetapi pertanyaan ini pada dasarnya memiliki konten filosofis yang tidak bisa begitu saja disingkirkan untuk kenyamanan.
Pertimbangkan eksperimen pikiran ini: Alex membalik koin, menangkapnya dan membalikkannya ke lengannya dengan tangan menutupi sisi yang menghadap ke atas. Bob berdiri di posisi yang tepat; dia melihat sekilas koin di tangan Alex, dan dengan demikian dapat menyimpulkan sisi mana yang menghadap ke atas sekarang. Namun, Carlos tidak melihat koin - dia tidak di tempat yang tepat. Pada titik ini, Alex bertanya kepada mereka berapa probabilitas bahwa koin menunjukkan kepala. Carlos menyarankan bahwa probabilitasnya adalah 0,5, karena itu adalah frekuensi jangka panjang dari kepala. Bob tidak setuju, ia dengan yakin menyatakan bahwa kemungkinannya tidak lain adalah tepat 0 .
Sekarang, siapa yang benar? Tentu saja mungkin saja Bob salah mengamat dan salah (mari kita asumsikan bahwa dia tidak salah lihat). Meskipun demikian, Anda tidak dapat meyakini bahwa keduanya benar dan berpegang pada hukum non-kontradiksi. (Saya kira bahwa jika Anda tidak percaya pada hukum non-kontradiksi, Anda bisa berpikir mereka berdua benar, atau formulasi lain semacam itu.) Sekarang bayangkan kasus yang sama, tetapi tanpa kehadiran Bob, saran Carlos bisa menjadi lebih benar (eh?) tanpa Bob di sekitar, karena tidak ada yang melihat koin? Penerapan hukum non-kontradiksi tidak begitu jelas dalam kasus ini, tetapi saya pikir jelas bahwa bagian-bagian dari situasi yang tampaknya penting tetap konstan dari yang pertama ke yang terakhir. Ada banyak upaya untuk mendefinisikan probabilitas, dan di masa depan mungkin masih ada banyak lagi, tetapi definisi probabilitas sebagai fungsi dari siapa yang kebetulan berdiri dan di mana mereka diposisikan memiliki sedikit daya tarik. Bagaimanapun (menebak dengan menggunakan frasa "interval kepercayaan "), kami bekerja dalam pendekatan Frequentist, dan di dalamnya apakah ada yang tahu keadaan koin yang sebenarnya tidak relevan. Ini bukan variabel acak - itu adalah nilai yang direalisasikan dan apakah itu menunjukkan kepala, atau itu menunjukkan ekor .
Seperti yang dicatat oleh @John, keadaan koin mungkin pada awalnya tidak tampak serupa dengan pertanyaan apakah interval kepercayaan mencakup rata-rata yang sebenarnya. Namun, alih-alih koin, kita dapat memahami ini secara abstrak sebagai nilai realisasi yang diambil dari distribusi Bernoulli dengan parameter . Dalam situasi koin, p = 0,5 , sedangkan untuk CI 95%, p =, 95 . Apa yang penting untuk disadari dalam membuat koneksi adalah bahwa bagian penting dari metafora bukanlah p yang mengatur situasi, tetapi bahwa koin terbalik atau CI yang dihitung adalah nilai yang direalisasikan , bukan variabel acak.p p=.5 p=.95 p
Penting bagi saya untuk mencatat pada titik ini bahwa semua ini adalah kasus dalam konsepsi Frequentist tentang probabilitas. Perspektif Bayesian tidak melanggar hukum non-kontradiksi, itu hanya dimulai dari asumsi metafisik yang berbeda tentang sifat realitas (lebih khusus tentang probabilitas). Orang lain di CV jauh lebih berpengalaman dalam perspektif Bayesian daripada saya, dan mungkin mereka dapat menjelaskan mengapa asumsi di balik pertanyaan Anda tidak berlaku dalam pendekatan Bayesian, dan bahwa pada kenyataannya, mungkin ada kemungkinan 95% dari rata-rata berbaring dalam kredibilitas 95%Interval, dalam kondisi tertentu termasuk (antara lain) bahwa yang digunakan sebelumnya akurat (lihat komentar oleh @DikranMarsupial di bawah). Namun, saya pikir semua akan setuju, bahwa begitu Anda menyatakan Anda bekerja dalam pendekatan Frequentist, tidak mungkin bahwa probabilitas rata-rata sebenarnya terletak di dalam 95% CI tertentu adalah 0,95.
sumber
Mengapa 95% CI tidak menyiratkan peluang 95% mengandung mean?
Ada banyak masalah yang harus diklarifikasi dalam pertanyaan ini dan di sebagian besar tanggapan yang diberikan. Saya akan membatasi diri hanya untuk mereka berdua.
Sebuah. Apa yang dimaksud dengan populasi? Apakah ada populasi yang benar-benar berarti?
Konsep rata-rata populasi tergantung pada model. Karena semua model salah, tetapi beberapa berguna, rerata populasi ini adalah fiksi yang didefinisikan hanya untuk memberikan interpretasi yang bermanfaat. Fiksi dimulai dengan model probabilitas.
Model probabilitas ditentukan oleh triplet mana X adalah ruang sampel (set non-kosong), F adalah keluarga himpunan bagian dari X dan P adalah ukuran probabilitas yang didefinisikan dengan baik didefinisikan lebih dari F (Ini mengatur perilaku data). Tanpa kehilangan keumuman, pertimbangkan hanya kasus diskrit. Populasi berarti didefinisikan oleh μ = Σ x ∈ X x P ( X = x ) , yaitu, itu merupakan tendensi sentral di bawah P
Dalam teori probabilitas, ukuran dianggap diketahui, oleh karena itu rata-rata populasi dapat diakses melalui operasi sederhana di atas. Namun, dalam praktiknya, probabilitas P hampir tidak diketahui. Tanpa probabilitas P , seseorang tidak dapat menggambarkan perilaku probabilistik data. Karena kami tidak dapat menetapkan probabilitas P yang tepat untuk menjelaskan perilaku data, kami menetapkan keluarga M yang berisi ukuran probabilitas yang mungkin mengatur (atau menjelaskan) perilaku data. Kemudian, model statistik klasik muncul ( X , F , M ) . Model di atas dikatakan sebagai model parametrik jika ada ΘP P P P M
Perhatikan bahwa, untuk setiap ukuran probabilitas , ada masing-masing definisi rata-rata μPθ∈M
Artinya, ada keluarga berarti populasi { μ q : q ∈ q } yang tergantung erat pada definisi M . Keluarga M
Pendekatan Bayesian mempertimbangkan probabilitas sebelumnya atas himpunan bagian (atau, setara, Θ ), tetapi dalam posting ini saya hanya akan berkonsentrasi pada versi klasik.M Θ
b. Apa definisi dan tujuan dari interval kepercayaan?
Seperti disebutkan di atas, mean populasi tergantung pada model dan memberikan interpretasi yang bermanfaat. Namun, kami memiliki kumpulan populasi rata-rata, karena model statistik didefinisikan oleh keluarga pengukuran probabilitas (setiap pengukuran probabilitas menghasilkan mean populasi). Oleh karena itu, berdasarkan percobaan, prosedur inferensial harus digunakan untuk memperkirakan set kecil (interval) yang mengandung kandidat yang baik dari populasi rata-rata. Satu prosedur yang terkenal adalah ( ) wilayah keyakinan, yang didefinisikan oleh satu set C α sehingga, untuk semua q ∈ q , P θ ( C α ( X ) ∋ μ1−α Cα θ∈Θ mana P θ ( C α ( X ) = ∅ ) = 0 (lihat Schervish, 1995). Ini adalah definisi yang sangat umum dan mencakup hampir semua interval kepercayaan. Di sini, P θ ( C α ( X )
Di satu sisi, sebelum mengamati data,Cα(X) Cα(X) μθ (1−α) θ∈Θ
Yaitu, setelah mengamati datax Cα(x) (1−α)100% μθ θ∈Θ
PS: Saya mengundang komentar, ulasan, kritik, atau bahkan keberatan dengan posting saya. Mari kita bahas secara mendalam. Karena saya bukan penutur asli bahasa Inggris, tulisan saya pasti mengandung kesalahan ketik dan kesalahan tata bahasa.
Referensi:
Schervish, M. (1995), Teori Statistik, ed Kedua, Springer.
sumber
Saya terkejut bahwa tidak ada yang mengemukakan contoh Berger tentang interval kepercayaan 75% yang pada dasarnya tidak berguna yang dijelaskan dalam bab kedua "The Likelihood Principle". Rinciannya dapat ditemukan dalam teks asli (yang tersedia secara gratis di Project Euclid ): apa yang penting tentang contoh ini adalah bahwa ia menggambarkan, dengan jelas, situasi di mana Anda tahu dengan kepastian absolut nilai parameter yang tampaknya tidak diketahui setelah mengamati data, tetapi Anda akan menyatakan bahwa Anda hanya memiliki kepercayaan diri 75% bahwa interval Anda mengandung nilai sebenarnya. Bekerja melalui rincian contoh itu adalah apa yang memungkinkan saya untuk memahami seluruh logika membangun interval kepercayaan.
sumber
Saya tidak tahu apakah ini harus ditanyakan sebagai pertanyaan baru, tetapi ini menjawab pertanyaan yang sama yang diajukan di atas dengan mengajukan eksperimen pemikiran.
Pertama, saya akan berasumsi bahwa jika saya memilih kartu bermain secara acak dari dek standar, kemungkinan saya memilih klub (tanpa melihatnya) adalah 13/52 = 25%.
Dan kedua, telah dinyatakan berkali-kali bahwa interval kepercayaan 95% harus ditafsirkan dalam hal mengulangi percobaan beberapa kali dan interval yang dihitung akan mengandung rata-rata sebenarnya 95% dari waktu - saya pikir ini ditunjukkan dengan cukup meyakinkan oleh James Waters simulasi. Kebanyakan orang tampaknya menerima interpretasi CI 95% ini.
Sekarang, untuk eksperimen pemikiran. Mari kita asumsikan bahwa kita memiliki variabel yang terdistribusi normal dalam populasi besar - mungkin ketinggian pria atau wanita dewasa. Saya memiliki asisten yang tak kenal lelah dan tak kenal lelah yang saya tugaskan untuk melakukan beberapa proses pengambilan sampel dengan ukuran sampel tertentu dari populasi dan menghitung mean sampel dan interval kepercayaan 95% untuk setiap sampel. Asisten saya sangat tertarik dan berhasil mengukur semua sampel yang mungkin dari populasi. Kemudian, untuk setiap sampel, asisten saya mencatat interval kepercayaan yang dihasilkan sebagai hijau (jika CI berisi mean sebenarnya) atau merah (jika CI tidak mengandung mean sebenarnya). Sayangnya, asisten saya tidak akan menunjukkan kepada saya hasil eksperimennya. Saya perlu mendapatkan beberapa informasi tentang ketinggian orang dewasa dalam populasi tetapi saya hanya punya waktu, sumber daya dan kesabaran untuk melakukan percobaan sekali. Saya membuat sampel acak tunggal (dengan ukuran sampel yang sama yang digunakan oleh asisten saya) dan menghitung interval kepercayaan (menggunakan persamaan yang sama).
Saya tidak memiliki cara untuk melihat hasil asisten saya. Jadi, berapa probabilitas bahwa sampel acak yang saya pilih akan menghasilkan CI hijau (yaitu interval berisi mean sebenarnya)?
Dalam pikiran saya, ini sama dengan situasi kartu yang diuraikan sebelumnya dan dapat diartikan sebagai probabilitas 95% bahwa interval yang dihitung berisi mean yang sebenarnya (yaitu hijau). Namun, kesimpulannya adalah bahwa interval kepercayaan 95% TIDAK dapat diartikan karena ada kemungkinan 95% bahwa interval tersebut mengandung rata-rata yang sebenarnya. Mengapa (dan di mana) alasan saya dalam eksperimen pemikiran di atas berantakan?
sumber
Jadi alih-alih memberikan informasi tentang probabilitas parameter yang terkandung dalam interval, itu memberikan informasi tentang probabilitas interval yang berisi parameter - karena interval dibuat dari variabel acak.
sumber
Untuk tujuan praktis, Anda tidak salah lagi untuk bertaruh bahwa 95% CI Anda memasukkan rata-rata sebenarnya pada odds 95: 5, daripada Anda bertaruh pada flip koin teman Anda pada odds 50:50.
Jika teman Anda sudah membalik koin, dan Anda berpikir ada kemungkinan 50% untuk menjadi kepala, maka Anda hanya menggunakan definisi kata probabilitas yang berbeda. Seperti yang orang lain katakan, untuk sering kali Anda tidak dapat menetapkan probabilitas untuk suatu peristiwa yang telah terjadi, tetapi Anda dapat menggambarkan probabilitas suatu peristiwa yang terjadi di masa depan menggunakan proses yang diberikan.
Dari blog lain: frequentist akan mengatakan: "Peristiwa tertentu tidak dapat memiliki probabilitas. Koin menunjukkan kepala atau ekor, dan kecuali Anda menunjukkannya, saya tidak bisa mengatakan apa faktanya. Hanya jika Anda akan mengulangi undian banyak, berkali-kali, apa pun jika Anda memvariasikan kondisi awal lemparan cukup kuat, saya berharap bahwa frekuensi relatif kepala dalam semua lemparan banyak akan mendekati 0,5 ". http://www.researchgate.net/post/What_is_the_difference_between_frequentist_and_bayesian_probability
sumber
Katakan bahwa CI yang Anda hitung dari kumpulan data tertentu yang Anda miliki adalah salah satu dari 5% dari CI yang mungkin tidak mengandung rerata. Seberapa dekat dengan menjadi interval kredibel 95% yang ingin Anda bayangkan? (Yaitu, seberapa dekat dengan mengandung mean dengan probabilitas 95%?) Anda tidak punya jaminan bahwa itu hampir sama sekali. Bahkan, CI Anda mungkin tidak tumpang tindih dengan bahkan satu pun dari 95% dari 95% CI yang benar-benar mengandung rerata. Belum lagi itu tidak mengandung mean itu sendiri, yang juga menunjukkan itu bukan interval kredibel 95%.
Mungkin Anda ingin mengabaikan ini dan secara optimis menganggap bahwa CI Anda adalah salah satu dari 95% yang mengandung mean. Oke, apa yang kami ketahui tentang CI Anda, mengingat CI-nya 95%? Bahwa itu mengandung mean, tetapi mungkin hanya jalan keluar pada ekstrem, tidak termasuk segala sesuatu yang lain di sisi lain mean. Tidak mungkin mengandung 95% dari distribusi.
Either way, tidak ada jaminan, bahkan mungkin tidak ada harapan yang masuk akal bahwa 95% CI Anda adalah interval yang kredibel 95%.
sumber
Jika Anda hanya menebak koin teman Anda terbalik dengan 50% kepala / ekor, maka Anda tidak melakukannya dengan benar.
Tentunya kredibilitas tebakan Anda tentang flip koin akan tergantung pada kondisi ini dan tidak selalu 50% sama (kadang-kadang metode 'kecurangan' Anda bekerja lebih baik).
Tebakan Anda secara keseluruhan mungkin, jika Anda curang, x> 50% dari waktu yang tepat, tetapi itu tidak selalu berarti bahwa probabilitas untuk setiap lemparan tertentu secara konstan x% kepala. Jadi akan sedikit aneh untuk memproyeksikan probabilitas keseluruhan Anda ke probabilitas untuk lemparan tertentu. Ini adalah 'jenis probabilitas' yang berbeda.
Ini sedikit tentang ke tingkat atau kedalaman apa yang Anda tentukan / tentukan 'probabilitas' .
Keyakinan tersebut tidak tergantung dari 'probabilitas spesifik dalam eksperimen / flip tertentu' dan independen dari 'probabilitas a priori' .
Kepercayaan diri adalah tentang ansambel eksperimen . Ini dibangun sedemikian rupa sehingga Anda tidak perlu tahu probabilitas atau distribusi a-priori dalam populasi.
Kepercayaan adalah tentang 'tingkat kegagalan' keseluruhan dari estimasi tetapi untuk kasus-kasus tertentu seseorang mungkin dapat menentukan variasi probabilitas yang lebih tepat .
( Variasi dalam probabilitas ini setidaknya ada secara implisit , dalam teori, dan kita tidak perlu mengetahuinya agar ada. Tetapi kita dapat secara eksplisit mengungkapkan probabilitas ini dengan menggunakan pendekatan Bayesian).
Contoh 1:
Jika Anda memiliki 1% populasi yang sakit, maka rata-rata Anda akan mendapatkan 1,98% dari hasil tes positif (1% dari 99% orang sehat tes positif dan 99% dari 1% orang sakit tes positif). Ini membuat interval CI 95% Anda, (bersyarat) ketika Anda menemukan tes positif , hanya memperbaiki 50% dari waktu.
Contoh 2:
(Sebaliknya berlaku untuk orang yang memiliki hasil mendekati 100, IQ mereka mungkin akan lebih mungkin dari 95% di dalam 95% -CI, dan ini harus mengkompensasi kesalahan yang Anda buat pada ekstrem sehingga Anda akhirnya menjadi benar dalam 95% kasus)
sumber
Pertama, mari kita berikan definisi interval kepercayaan, atau, dalam ruang dimensi lebih besar dari satu, wilayah kepercayaan. Definisi ini adalah versi ringkas dari yang diberikan oleh Jerzy Neyman dalam makalahnya tahun 1937 kepada Royal Society.
Sekarang pertimbangkan untuk setiap nilai parameter yang mungkinhal
di mana kurung kotak adalah kurung Iverson. Ini adalah hasil utama untuk interval kepercayaan atau wilayah. Dikatakan bahwa harapan[ p ∈ C( s , α ) ] hal α hal hal hal
Jika selain itu daerah penerimaan adalah seperti itus∈A(s,α)⟺s∈A(s,α)
Contoh buku teks untuk memperkirakan mean populasi dengan interval kepercayaan standar yang dibuat tentang statistik normal adalah kasus khusus dari asumsi sebelumnya. Oleh karena itu standar 95% interval kepercayaan tidak mengandung berarti dengan probabilitas 0,95; tetapi korespondensi ini umumnya tidak berlaku.
sumber
Ada beberapa jawaban menarik di sini, tetapi saya pikir saya akan menambahkan sedikit demonstrasi langsung menggunakan R. Kami baru-baru ini menggunakan kode ini dalam kursus statistik untuk menyoroti bagaimana interval kepercayaan bekerja. Inilah yang kode lakukan:
1 - Ini sampel dari distribusi yang dikenal (n = 1000)
2 - Ini menghitung 95% CI untuk rata-rata setiap sampel
3 - Bertanya apakah CI sampel masing-masing termasuk rata-rata yang sebenarnya.
4 - Ini melaporkan di konsol fraksi CI yang termasuk mean sebenarnya.
Saya baru saja menjalankan skrip beberapa kali dan sebenarnya tidak terlalu jarang menemukan bahwa kurang dari 94% CI mengandung rata-rata yang sebenarnya. Setidaknya bagi saya, ini membantu menghilangkan gagasan bahwa interval kepercayaan memiliki kemungkinan 95% berisi parameter sebenarnya.
Semoga ini membantu!
sumber