Varian tertimbang yang tidak sesuai sudah dibahas di sini dan di tempat lain tetapi tampaknya masih ada sejumlah kebingungan yang mengejutkan. Tampaknya ada konsensus terhadap formula yang disajikan dalam tautan pertama serta di artikel Wikipedia . Ini juga terlihat seperti rumus yang digunakan oleh R, Mathematica, dan GSL (tetapi bukan MATLAB). Namun, artikel Wikipedia juga berisi baris berikut yang terlihat seperti pemeriksaan kewarasan yang bagus untuk implementasi varians tertimbang:
Misalnya, jika nilai {2,2,4,5,5,5} diambil dari distribusi yang sama, maka kita dapat memperlakukan set ini sebagai sampel tanpa bobot, atau kita dapat memperlakukannya sebagai sampel tertimbang {2,4, 5} dengan bobot yang sesuai {2,1,3}, dan kita harus mendapatkan hasil yang sama.
Perhitungan saya memberikan nilai 2,1667 untuk varians dari nilai asli dan 2,9545 untuk varian tertimbang. Haruskah saya benar-benar berharap mereka sama? Mengapa atau mengapa tidak?
sumber
Jawaban:
Ya, Anda harus mengharapkan kedua contoh (tidak berbobot vs berbobot) untuk memberi Anda hasil yang sama.
Saya telah menerapkan dua algoritma dari artikel Wikipedia.
Yang ini berfungsi:
Namun yang ini (menggunakan bobot fraksional) tidak berfungsi untuk saya:
Saya masih menyelidiki alasan mengapa persamaan kedua tidak berfungsi sebagaimana dimaksud.
/ EDIT: Menemukan alasan mengapa persamaan kedua tidak berfungsi seperti yang saya kira: Anda dapat menggunakan persamaan kedua hanya jika Anda memiliki bobot yang dinormalisasi atau bobot varians (reliabilitas), dan BUKAN tidak bias, karena jika Anda tidak gunakan bobot "ulangi" (menghitung berapa kali pengamatan diamati dan karenanya harus diulang dalam operasi matematika Anda), Anda kehilangan kemampuan untuk menghitung jumlah total pengamatan, dan dengan demikian Anda tidak dapat menggunakan faktor koreksi.
Jadi ini menjelaskan perbedaan dalam hasil Anda menggunakan varian tertimbang dan tidak berbobot: perhitungan Anda bias.
Jadi, jika Anda ingin memiliki varian tertimbang yang tidak bias, gunakan hanya "ulangi" bobot dan gunakan persamaan pertama yang saya posting di atas. Jika itu tidak mungkin, yah, Anda tidak dapat menahannya.
Saya juga telah memperbarui artikel Wikipedia jika Anda ingin info lebih lanjut: http://en.wikipedia.org/wiki/Weighted_arithmetic_mean#Weighted_sample_variance
Dan artikel terkait tentang kovarians tertimbang yang tidak bias (yang sebenarnya adalah varian yang sama karena Polarisasi Identitas ): Persamaan yang benar untuk kovarians sampel tidak bias tertimbang
sumber