Saya sedang mencari persamaan yang tepat untuk menghitung kovarians sampel yang tidak bias tertimbang. Sumber-sumber internet sangat jarang pada tema ini dan mereka semua menggunakan persamaan yang berbeda.
Persamaan yang paling mungkin saya temukan adalah persamaan ini:
Dari: https://en.wikipedia.org/wiki/Sample_mean_and_sample_covariance#Weighted_samples
Tentu saja, Anda harus menghitung rata-rata sampel tertimbang (tidak bias) sebelumnya.
Namun, saya telah menemukan beberapa formula lain seperti:
Atau saya bahkan telah melihat beberapa kode sumber dan makalah akademis hanya menggunakan rumus kovarian standar tetapi dengan mean sampel tertimbang alih-alih sampel mean ...
Adakah yang bisa membantu saya dan menjelaskan?
/ EDIT: bobot saya hanyalah jumlah pengamatan untuk sampel dalam dataset, jadi weights.sum () = n
sumber
Jawaban:
Menemukan solusi dalam buku 1972 (George R. Price, Ann. Hum. Genet., Lond, pp485-490, Perpanjangan matematika pemilihan kovarians, 1972) .
Biovaskuler sampel tertimbang bias:
Dan kovarians sampel tertimbang yang diberikan dengan menerapkan koreksi Bessel:
Di mana adalah rata-rata sampel tertimbang (tidak bias):μ∗
Catatan Penting: ini hanya berfungsi jika bobotnya adalah "ulangi" -berat jenis, yang berarti bahwa setiap bobot mewakili jumlah kemunculan satu pengamatan, dan bahwa mana mewakili ukuran sampel nyata (jumlah total nyata sampel, akuntansi untuk bobot).∑Ni=1wi=N∗ N∗
Saya telah memperbarui artikel di Wikipedia, di mana Anda juga akan menemukan persamaan untuk varians sampel tertimbang yang tidak bias:
https://en.wikipedia.org/wiki/Weighted_arithmetic_mean#Weighted_sample_covariance
Catatan praktis: Saya menyarankan Anda untuk terlebih dahulu mengalikan kolom-demi-kolom dengan dan dan kemudian melakukan perkalian matriks dengan untuk membungkus sesuatu dan secara otomatis melakukan penjumlahan. Misalnya dalam Python Pandas / kode Numpy:wi (xi−μ∗) (xi−μ∗)
Melakukan beberapa pemeriksaan kewarasan menggunakan dataset non-tertimbang dan dataset tertimbang yang setara, dan berfungsi dengan benar.
sumber