Misalkan dan masing-masing diambil iid dari beberapa distribusi, dengan independen dari . The secara ketat positif. Anda mengamati semua , tetapi bukan ; Anda lebih mengamati . Saya tertarik memperkirakan dari informasi ini. Jelas penaksir tidak bias, dan dapat dihitung dengan memberikan informasi yang ada.w i x i w i w i x i ∑ i x i w i E [ x ] ˉ x = ∑ i w i x i
Bagaimana saya bisa menghitung kesalahan standar estimator ini? Untuk sub-kasus di mana hanya mengambil nilai 0 dan 1, saya secara naif mencoba pada dasarnya mengabaikan variabilitas dalam , tetapi menemukan bahwa ini berkinerja buruk untuk ukuran sampel lebih kecil dari sekitar 250. (Dan ini mungkin tergantung pada varians dari .) Tampaknya saya mungkin tidak memiliki cukup informasi untuk hitung kesalahan standar 'lebih baik'.wiwi
sumber
w=rep(1, length(x))
, makaweighted.var.se(rnorm(50), rep(1, 50))
sekitar0.014
. Saya pikir rumus tidak adasum(w^2)
dalam pembilang, sejak kapanP=1
, variansnya1/(n*(n-1)) * sum((x-xbar)^2)
. Saya tidak dapat memeriksa artikel yang dikutip karena berada di belakang paywall, tapi saya pikir koreksi itu. Anehnya, solusi Wikipedia (berbeda) menjadi merosot ketika semua bobotnya sama: en.wikipedia.org/wiki/… .Varians dari perkiraan Anda mengingat adalah Σ w 2 i V sebuah r ( X )wi
Karena estimasi Anda tidak bias untuk setiapwi, varians dari mean bersyaratnya adalah nol. Karenanya, varian estimasi Anda adalah
Var(X)E(β w 2 i
sumber