Pertimbangkan distribusi beta untuk satu set peringkat di [0,1]. Setelah menghitung rata-rata:
Apakah ada cara untuk memberikan interval kepercayaan sekitar rata-rata ini?
mean
beta-distribution
Dominikus
sumber
sumber
Jawaban:
Meskipun ada metode khusus untuk menghitung interval kepercayaan untuk parameter dalam distribusi beta, saya akan menjelaskan beberapa metode umum, yang dapat digunakan untuk (hampir) semua jenis distribusi , termasuk distribusi beta, dan mudah diimplementasikan dalam R .
Interval kepercayaan kemungkinan profil
Mari kita mulai dengan estimasi kemungkinan maksimum dengan interval kepercayaan kemungkinan profil yang sesuai. Pertama kita perlu beberapa data sampel:
Maksud sebenarnya / teoritis adalah
Sekarang kita harus membuat fungsi untuk menghitung fungsi kemungkinan log negatif untuk sampel dari distribusi beta, dengan mean sebagai salah satu parameter. Kita dapat menggunakan
dbeta()
fungsi, tetapi karena ini tidak menggunakan parametrisation yang melibatkan mean, kita harus menyatakan parameternya ( α dan β ) sebagai fungsi dari mean dan beberapa parameter lainnya (seperti standar deviasi):Untuk menemukan perkiraan kemungkinan maksimum, kita dapat menggunakan
mle()
fungsi distats4
perpustakaan:Abaikan saja peringatan untuk saat ini. Itu disebabkan oleh algoritma pengoptimalan yang mencoba nilai yang tidak valid untuk parameter, memberikan nilai negatif untuk α dan / atau β . (Untuk menghindari peringatan, Anda dapat menambahkan
lower
argumen dan mengubah optimasi yangmethod
digunakan.)Sekarang kami memiliki taksiran dan interval kepercayaan untuk dua parameter kami:
Perhatikan bahwa, seperti yang diharapkan, interval kepercayaan tidak simetris:
(Garis magenta kedua-luar menunjukkan interval kepercayaan 95%.)
Juga perhatikan bahwa bahkan hanya dengan 10 pengamatan, kami mendapatkan perkiraan yang sangat baik (interval kepercayaan yang sempit).
Sebagai alternatif
mle()
, Anda dapat menggunakanfitdistr()
fungsi dariMASS
paket. Ini juga menghitung penaksir kemungkinan maksimum, dan memiliki keuntungan bahwa Anda hanya perlu menyediakan kerapatan, bukan kemungkinan log negatif, tetapi tidak memberi Anda interval kepercayaan kemungkinan profil, hanya interval kepercayaan asimtotik (simetris).Pilihan yang lebih baik adalah
mle2()
(dan fungsi terkait) daribbmle
paket, yang agak lebih fleksibel dan kuat daripadamle()
, dan memberikan plot yang sedikit lebih bagus.Interval kepercayaan bootstrap
Pilihan lain adalah menggunakan bootstrap. Ini sangat mudah digunakan dalam R, dan Anda bahkan tidak perlu menyediakan fungsi kerapatan:
Bootstrap memiliki keunggulan tambahan yang berfungsi meskipun data Anda tidak berasal dari distribusi beta.
Interval kepercayaan asimptotik
Untuk interval kepercayaan pada mean, jangan lupakan interval kepercayaan asimptotik lama yang baik berdasarkan teorema limit pusat (dan distribusi- t ). Selama kita memiliki ukuran sampel yang besar (sehingga CLT berlaku dan distribusi rata-rata sampel mendekati normal) atau nilai-nilai besar dari α dan β (sehingga distribusi beta sendiri kira-kira normal), ia bekerja dengan baik. Di sini kita tidak memiliki keduanya, tetapi interval kepercayaan masih tidak terlalu buruk:
Untuk nilai n yang sedikit lebih besar (dan nilai yang tidak terlalu ekstrim dari kedua parameter), interval kepercayaan asimptotik bekerja sangat baik.
sumber
Lihat regresi Beta. Pengantar yang baik untuk melakukannya menggunakan R dapat ditemukan di sini:
http://cran.r-project.org/web/packages/betareg/vignettes/betareg.pdf
Cara lain (sangat mudah) untuk membangun interval kepercayaan adalah dengan menggunakan pendekatan boostrap non-parametrik. Wikipedia memiliki info bagus:
http://en.wikipedia.org/wiki/Bootstrapping_%28statistics%29
Juga video yang bagus di sini:
http://www.youtube.com/watch?v=ZCXg64l9R_4
sumber