Jika saya mengerti dengan benar, interval kepercayaan parameter adalah interval yang dibangun oleh metode yang menghasilkan interval yang berisi nilai sebenarnya untuk proporsi sampel tertentu. Jadi 'kepercayaan' adalah tentang metode daripada interval yang saya hitung dari sampel tertentu.
Sebagai pengguna statistik, saya selalu merasa tertipu oleh ini karena ruang semua sampel adalah hipotetis. Yang saya miliki hanyalah satu sampel dan saya ingin tahu apa yang dikatakan sampel tentang parameter.
Apakah penilaian ini salah? Adakah cara melihat interval kepercayaan, setidaknya dalam beberapa keadaan, yang akan berarti bagi pengguna statistik?
[Pertanyaan ini muncul dari pikiran kedua setelah menyela interval kepercayaan dalam jawaban math.se https://math.stackexchange.com/questions/7564/calculating-a-sample-size-based-onased-oncidence-level/7572/7572 # 7572 ]
sumber
Pendekatan alternatif yang relevan dengan Q kedua Anda, "Apakah ada cara untuk melihat interval kepercayaan, setidaknya dalam beberapa keadaan, yang akan bermakna bagi pengguna statistik?":
Anda harus melihat inferensi Bayesian dan interval yang kredibel yang dihasilkan . Interval kredibel 95% dapat diartikan sebagai interval yang Anda yakini memiliki 95% probabilitas termasuk nilai parameter yang sebenarnya. Harga yang Anda bayar adalah bahwa Anda harus menempatkan distribusi probabilitas sebelumnya pada nilai-nilai yang Anda yakini kemungkinan akan diambil oleh parameter sebenarnya sebelum mengumpulkan data. Dan prioritas Anda mungkin berbeda dari prioritas orang lain, sehingga interval yang dapat dipercaya yang Anda buat juga mungkin berbeda bahkan ketika Anda menggunakan data yang sama.
Ini hanya upaya cepat dan kasar saya untuk meringkas! Buku teks terbaru yang bagus dengan fokus praktis adalah:
Andrew Gelman, John B. Carlin, Hal S. Stern dan Donald B. Rubin. "Analisis Data Bayesian" (edisi ke-2). Chapman & Hall / CRC, 2003. ISBN 978-1584883883
sumber
Saya pikir premis dari pertanyaan ini cacat karena menyangkal perbedaan antara yang tidak pasti dan yang diketahui .
Menjelaskan flip koin memberikan analogi yang baik. Sebelum koin dibalik, hasilnya tidak pasti; setelah itu, itu tidak lagi "hipotetis." Membingungkan fait kaki ini dengan situasi aktual yang ingin kita pahami (perilaku koin, atau keputusan yang harus dibuat sebagai hasil dari hasilnya) pada dasarnya menyangkal peran probabilitas dalam memahami dunia.
Kontras ini dilemparkan dalam relief tajam dalam arena eksperimental atau peraturan. Dalam kasus seperti itu ilmuwan atau regulator tahu mereka akan dihadapkan pada situasi yang hasilnya, kapan saja sebelumnya, tidak diketahui, namun mereka harus membuat penentuan penting seperti bagaimana merancang percobaan atau menetapkan kriteria untuk digunakan dalam menentukan kepatuhan terhadap peraturan. (untuk pengujian obat-obatan, keselamatan di tempat kerja, standar lingkungan, dan sebagainya). Orang-orang ini dan lembaga-lembaga tempat mereka bekerja membutuhkan metode dan pengetahuan tentang karakteristik probabilistik dari metode-metode tersebut untuk mengembangkan strategi yang optimal dan dapat dipertahankan, seperti desain eksperimen yang baik dan prosedur pengambilan keputusan yang adil yang sesedikit mungkin dilakukan.
Interval kepercayaan, meskipun pembenarannya buruk secara klasik, cocok dengan kerangka kerja teoretik keputusan ini. Ketika suatu metode membangun interval acak memiliki kombinasi sifat-sifat yang baik, seperti memastikan cakupan interval minimal yang diharapkan dan meminimalkan panjang interval yang diharapkan - keduanya sifat priori , bukan yang posteriori - kemudian berakhir karir panjang menggunakan metode itu kita dapat meminimalkan biaya yang terkait dengan tindakan yang ditunjukkan oleh metode itu.
sumber
Anda benar dalam mengatakan bahwa interval kepercayaan 95% adalah hal-hal yang dihasilkan dari menggunakan metode yang bekerja di 95% kasus, daripada setiap interval individu yang memiliki kemungkinan 95% berisi nilai yang diharapkan.
"Dasar logis dan interpretasi batas kepercayaan, bahkan sekarang, adalah masalah kontroversi." {David Colquhoun, 1971, Ceramah tentang Biostatistik}
Kutipan itu diambil dari buku teks statistik yang diterbitkan pada tahun 1971, tetapi saya berpendapat bahwa itu masih benar pada tahun 2010. Kontroversi ini mungkin paling ekstrim dalam hal interval kepercayaan untuk proporsi binomial. Ada banyak metode yang bersaing untuk menghitung interval kepercayaan itu, tetapi mereka semua tidak akurat dalam satu atau lebih pengertian dan bahkan metode berkinerja terburuk memiliki pendukung di antara para penulis buku teks. Bahkan interval yang disebut 'tepat' gagal menghasilkan properti yang diharapkan dari interval kepercayaan.
Dalam sebuah makalah yang ditulis untuk ahli bedah (dikenal luas karena minat mereka dalam statistik!), John Ludbrook dan saya berpendapat untuk penggunaan rutin interval kepercayaan yang dihitung dengan menggunakan Bayesian yang seragam sebelumnya karena interval tersebut memiliki sifat frequentist sebaik metode lainnya (rata-rata). tepatnya cakupan 95% dari semua proporsi sebenarnya) tetapi, yang penting, cakupan jauh lebih baik dari semua proporsi yang diamati (tepatnya cakupan 95%). Makalah ini, karena target audiensnya, tidak terlalu rinci sehingga tidak meyakinkan semua ahli statistik, tetapi saya sedang mengerjakan makalah lanjutan dengan set lengkap hasil dan pembenaran.
Ini adalah kasus di mana pendekatan Bayesian memiliki sifat frequentist sebaik pendekatan frequentist, sesuatu yang terjadi cukup sering. Asumsi seragam sebelumnya tidak bermasalah karena distribusi seragam proporsi populasi dibangun ke dalam setiap perhitungan cakupan sering yang saya temui.
Anda bertanya: "Apakah ada cara untuk melihat interval kepercayaan, setidaknya dalam beberapa keadaan, yang akan bermakna bagi pengguna statistik?" Jawaban saya, kemudian, adalah untuk interval kepercayaan binomial seseorang bisa mendapatkan interval yang mengandung proporsi populasi tepat 95% dari waktu untuk semua proporsi yang diamati. Itu adalah ya. Namun, penggunaan interval kepercayaan secara konvensional mengharapkan cakupan untuk semua proporsi populasi dan untuk itu jawabannya adalah "Tidak!"
Panjangnya jawaban untuk pertanyaan Anda, dan berbagai respons terhadapnya menunjukkan bahwa interval kepercayaan banyak disalahpahami. Jika kami mengubah tujuan kami dari cakupan untuk semua nilai parameter benar ke cakupan nilai parameter benar untuk semua nilai sampel, mungkin akan lebih mudah karena interval kemudian akan dibentuk agar relevan langsung dengan nilai yang diamati daripada untuk kinerja metode per se.
sumber
Ini diskusi yang bagus. Saya merasa bahwa interval kredibel Bayesian dan interval dukungan kemungkinan adalah cara yang harus ditempuh, serta probabilitas posterior Bayes tentang peristiwa yang menarik (misalnya, obat manjur). Tetapi menggantikan nilai-P dengan interval kepercayaan adalah keuntungan besar. Hampir setiap masalah jurnal medis terbaik seperti NEJM dan JAMA memiliki makalah dengan "tidak adanya bukti bukanlah bukti ketidakhadiran" masalah dalam abstrak mereka. Penggunaan interval kepercayaan sebagian besar akan mencegah kesalahan seperti itu. Sebuah teks kecil yang hebat adalah http://www.amazon.com/Statistics-Confidence-Intervals-Statistics-Guidelines/dp/0727913751
sumber
Untuk menjawab pertanyaan Anda secara langsung: Misalkan Anda merenungkan penggunaan mesin untuk mengisi kotak sereal dengan jumlah sereal tertentu. Jelas, Anda tidak ingin memenuhi sampai melimpahi kotak. Anda ingin menilai keandalan mesin. Anda melakukan serangkaian tes seperti: (a) Gunakan mesin untuk mengisi kotak dan (b) Ukur jumlah sereal yang diisi dalam kotak.
Dengan menggunakan data yang dikumpulkan, Anda membuat interval kepercayaan untuk jumlah sereal yang kemungkinan besar akan diisi mesin. Interval kepercayaan ini memberi tahu kita bahwa interval yang kita peroleh memiliki probabilitas 95% bahwa itu akan mengandung jumlah sereal yang sebenarnya yang akan dimasukkan mesin ke dalam kotak. Seperti yang Anda katakan, interpretasi interval kepercayaan bergantung pada hipotesis, sampel tak terlihat yang dihasilkan oleh metode yang dipertimbangkan. Tetapi, inilah tepatnya yang kita inginkan dalam konteks kita. Dalam konteks di atas, kita akan menggunakan mesin berulang kali untuk mengisi kotak dan dengan demikian kita peduli dengan realisasi hipotetis yang tak terlihat dari jumlah sereal yang diisi mesin di dalam kotak.
Untuk mengambil abstrak dari konteks di atas: interval kepercayaan memberi kami jaminan bahwa jika kami menggunakan metode yang sedang diselidiki (dalam contoh di atas metode = mesin) berulang kali ada kemungkinan 95% bahwa interval kepercayaan akan memiliki parameter sebenarnya .
sumber