Pertimbangkan percobaan yang menghasilkan rasio antara 0 dan 1. Bagaimana rasio ini diperoleh seharusnya tidak relevan dalam konteks ini. Itu diuraikan dalam versi sebelumnya dari pertanyaan ini , tetapi dihapus untuk kejelasan setelah diskusi tentang meta .
Eksperimen ini diulangi kali, sedangkan kecil (sekitar 3-10). The diasumsikan independen dan terdistribusi secara identik. Dari ini kami memperkirakan rata-rata dengan menghitung rata-rata , tetapi bagaimana cara menghitung interval kepercayaan yang sesuai ?n X i ¯ X [ U , V ]
Saat menggunakan pendekatan standar untuk menghitung interval kepercayaan, terkadang lebih besar dari 1. Namun, intuisi saya adalah bahwa interval kepercayaan yang benar ...
- ... harus berada dalam kisaran 0 dan 1
- ... harus menjadi lebih kecil dengan meningkatnya
- ... kira-kira sesuai dengan yang dihitung menggunakan pendekatan standar
- ... dihitung dengan metode suara yang matematis
Ini bukan persyaratan mutlak, tetapi setidaknya saya ingin mengerti mengapa intuisi saya salah.
Perhitungan berdasarkan jawaban yang ada
Berikut ini, interval kepercayaan yang dihasilkan dari jawaban yang ada dibandingkan untuk .
Pendekatan Standar (alias "Matematika Sekolah")
, , dengan demikian interval kepercayaan 99% adalah . Ini bertentangan dengan intuisi 1.[ 0,865 , 1,053 ]
Memotong (disarankan oleh @soakley di komentar)
Hanya dengan menggunakan pendekatan standar maka memberikan hasilnya mudah dilakukan. Tetapi apakah kita diizinkan untuk melakukan itu? Saya belum yakin bahwa batas bawah tetap konstan (-> 4.)
Model Regresi Logistik (disarankan oleh @Rose Hartman)
Data yang : Menghasilkan , mengubahnya kembali menghasilkan . Jelas, 6.90 adalah outlier untuk data yang ditransformasikan sementara 0.99 bukan untuk data yang tidak diubah, menghasilkan interval kepercayaan yang sangat besar. (-> 3.)[ 0.173 , 7.87 ] [ 0.543 , 0.999 ]
Interval kepercayaan proporsi binomial (disarankan oleh @Tim)
Pendekatannya terlihat cukup bagus, tetapi sayangnya tidak sesuai dengan percobaan. Hanya menggabungkan hasil dan menafsirkannya sebagai satu percobaan Bernoulli yang diulang besar seperti yang disarankan oleh @ZahavaKor menghasilkan hal-hal berikut:
5 ∗ 1000 [ 0,9511 , 0,9657 ] X i dari total . Memberi makan ini ke Adj. Kalkulator Wald memberi . Ini tampaknya tidak realistis, karena tidak ada tunggal di dalam interval itu! (-> 3.)
Bootstrapping (disarankan oleh @soakley)
Dengan kami memiliki 3125 kemungkinan permutasi. Mengambil sarana tengah permutasi, kita mendapatkan . Terlihat tidak terlalu buruk, meskipun saya akan mengharapkan interval yang lebih besar (-> 3.). Namun, per konstruksi tidak pernah lebih besar dari . Jadi untuk sampel kecil itu akan lebih baik daripada menyusut untuk meningkatkan (-> 2.). Setidaknya inilah yang terjadi dengan sampel yang diberikan di atas.3093[0,91,0,99][min(Xi),max(Xi)]n
sumber
Jawaban:
Pertama, untuk memperjelas, apa yang Anda hadapi bukanlah distribusi binomial, seperti yang disarankan oleh pertanyaan Anda (Anda menyebutnya sebagai eksperimen Bernoulli). Distribusi binomial bersifat diskrit --- hasilnya adalah keberhasilan atau kegagalan. Hasil Anda adalah rasio setiap kali Anda menjalankan percobaan , bukan kumpulan keberhasilan dan kegagalan yang kemudian Anda hitung dengan satu rasio ringkasan. Karena itu, metode untuk menghitung interval kepercayaan proporsi binomial akan membuang banyak informasi Anda. Namun Anda benar bahwa itu bermasalah untuk memperlakukan ini seolah-olah itu terdistribusi secara normal karena Anda bisa mendapatkan CI yang melampaui rentang yang mungkin dari variabel Anda.
Saya merekomendasikan untuk memikirkan hal ini dalam hal regresi logistik. Jalankan model regresi logistik dengan variabel rasio Anda sebagai hasil dan tanpa prediktor. Intersep dan CI-nya akan memberikan apa yang Anda butuhkan dalam log, dan kemudian Anda dapat mengubahnya kembali menjadi proporsi. Anda juga dapat melakukan sendiri konversi logistik, menghitung CI dan kemudian mengonversi kembali ke skala asli. Python saya sangat buruk, tapi begini caranya Anda bisa melakukannya di R:
Berikut adalah batas bawah dan atas pada CI 99% untuk data ini:
sumber
Anda mungkin ingin mencoba resampling / bootstrap. Mari kita lihat kasus sederhana yang Anda sebutkan.
Dengan 3 titik data dari 0,99, 0,94, dan 0,94, Anda bahkan tidak akan melakukan resampling karena Anda hanya bisa mencantumkan semua 27 permutasi yang mungkin, temukan mean dalam setiap kasus, dan kemudian mengurutkan mean.
Pertanyaannya di sini: Bagaimana kita membuat interval kepercayaan untuk parameter dari tes permutasi? memberikan lebih banyak detail, termasuk beberapa kode R.
sumber
Interval kepercayaan binomial telah lama menjadi bahan perdebatan para ahli statistik. Masalah Anda mempertimbangkan rasio kurang dari 100%, tetapi menjadi lebih bermasalah jika kami menggunakan 100%. Salah satu cara berwawasan untuk mengajukan pertanyaan adalah:
Ada sejumlah metode untuk menghitung ekor ini. Saya akan merekomendasikan memeriksa Wikipedia untuk matematika, atau jika Anda hanya ingin jawabannya, cari kalkulator interval binomial seperti ini (yang kebetulan juga memiliki beberapa penjelasan lebih lanjut tentang matematika di baliknya).
sumber
Pendekatan Bayesian:
sumber