Misalkan kita memiliki proses Bernoulli dengan probabilitas kegagalan (yang akan menjadi kecil, katakanlah, ) dari mana kita sampel sampai kita menemukan kegagalan. Kami dengan demikian memperkirakan probabilitas kegagalan sebagai q : = 10 / N di mana N adalah jumlah sampel.
Pertanyaan : Apakah q sebuah estimasi bias dari q ? Dan, jika demikian, apakah ada cara untuk memperbaikinya?
Saya khawatir bahwa bersikeras sampel terakhir adalah bias yang gagal estimasi.
Jawaban:
Memang benar bahwa q adalah estimasi bias q dalam arti bahwa E ( q )q^ q , tetapi Anda tidak harus selalu biarkan ini menghalangi Anda. Skenario yang tepat ini dapat digunakan sebagai kritik terhadap gagasan bahwa kita harus selalu menggunakan penduga yang tidak bias, karena di sini bias lebih merupakan artefak dari eksperimen tertentu yang sedang kita lakukan. Data terlihat persis seperti ketika kita telah memilih jumlah sampel di muka, jadi mengapa kesimpulan kita harus berubah?E(q^)≠q
Menariknya, jika Anda mengumpulkan data dengan cara ini dan kemudian menuliskan fungsi kemungkinan di bawah model binomial (ukuran sampel tetap) dan negatif, Anda akan menemukan bahwa keduanya proporsional satu sama lain. Ini berarti bahwa q hanya biasa estimasi maksimum likelihood di bawah model binomial negatif, yang tentu saja adalah perkiraan yang masuk akal.q^
sumber
Itu tidak bersikeras bahwa sampel terakhir adalah kegagalan yang bias estimasi, itu mengambil kebalikan dariN
Jadi dalam contoh Anda tetapi E[10E[N10]=1q . Ini dekat dengan membandingkan rata-rata aritmatika dengan rata-rata harmonikE[10N]≠q
Kabar buruknya adalah bahwa bias dapat meningkat karena semakin kecil, meskipun tidak banyak sekali q sudah kecil. Berita baiknya adalah bias menurun seiring dengan meningkatnya jumlah kegagalan. Tampaknya jika Anda memerlukan f kegagalan, maka bias dibatasi di atas oleh faktor multiplikasi fq q f untukqkecilff−1 q ; Anda tidak ingin pendekatan ini ketika Anda berhenti setelah kegagalan pertama
Berhenti setelah kegagalan, dengan q = 0,01 Anda akan mendapatkan E [ N10 q=0.01 tetapi E[10E[N10]=100 , sedangkan denganq=0,001Anda akan mendapatkanE[NE[10N]≈0.011097 q=0.001 tetapi E[10E[N10]=1000 . Bias sekitar10E[10N]≈0.001111 faktor multiplikasi 109
sumber
sumber
10+rnbinom(10000,10,0.02)
10/(10+rnbinom(10000,10,0.02))
. Parameterisasi adalah dalam hal jumlah keberhasilan / kegagalan daripada jumlah total percobaan, jadi Anda harus menambahkan k = 10 kembali. Perhatikan bahwa penaksir tidak bias akan menjadi9/(9+rnbinom(10000,10,0.02))
, satu lebih sedikit di pembilang dan penyebut.