Peninjau buku saya menanyakan alasan mengapa saya menggunakan data tidak tertimbang, alih-alih data tertimbang. Saya telah membahas masalah ini dengan seorang ahli statistik dan tanggapannya sejalan
Jika Anda memiliki pengamatan independen dan Anda mengambil rata-rata keseluruhan, variansnya selalu lebih kecil dari varians dari mean tertimbang sebagai estimator. ... Jadi interval kepercayaan akan diperlebar!
Sejak itu saya menemukan pertanyaan berikut di situs web ini, dan dari pemahaman saya, mereka menyarankan bahwa variansnya harus sama. Jadi, bisakah seseorang, tolong, dengan pikiran yang lebih berbakat secara statistik daripada saya, tolong konfirmasikan respons dari ahli statistik dan jelaskan secara teori, atau dengan contoh yang berhasil.
sumber
Jawaban:
Pertanyaan Anda yang ditautkan ditangani dengan menggunakan bobot sebagai cara pintas untuk menangani perbedaan per poin data yang sama berbobotnya di mana beberapa titik data muncul lebih dari satu kali.
@whuber telah membahas dalam komentar tentang situasi di mana varian semua titik data sama. Jadi saya akan membahas situasi di mana mereka tidak sama. Dalam situasi inilah rata-rata tertimbang yang optimal menghasilkan varian yang lebih rendah daripada rata-rata yang tidak berbobot, yaitu rata-rata yang sama-sama berbobot.
Mean tertimbang, menggunakan bobot , sama dengan , dan memiliki varian = . Jadi kami ingin meminimalkan , tunduk pada dan untuk semua i.wi Σni=1wixi Σni=1w2iVar(xi) Σni=1w2iVar(xi) Σni=1wi=1 wi≥0
Kondisi Karush-Kuhn-Tucker, yang diperlukan dan cukup untuk minimum global untuk masalah ini, mengingat bahwa itu adalah masalah Pemrograman Kuadratik cembung, menghasilkan solusi bentuk tertutup, yaitu:
optimal untuk 1 = 1 .. n.wi=[1/Var(xi)]/Σnj=1[1/Var(xj)]
rata-rata tertimbang optimal yang sesuai = .1/Σni=1[1/Var(xi)]
Sebaliknya, bobot yang sama berarti untuk semua i, di mana n adalah jumlah titik data. Seperti yang ditunjukkan oleh whuber, bobot yang sama adalah optimal jika semua varian titik data sama, yang dapat dilihat dari rumus di atas untuk optimal . Namun, sebagaimana dibuktikan oleh formula itu, bobot yang sama tidak optimal jika varians titik data tidak semuanya sama, dan memang menghasilkan varians yang lebih besar (dari rata-rata tertimbang) daripada bobot optimal. Varians dari rata-rata tertimbang sama, yaitu, varian dari rata-rata tertimbang menggunakan bobot yang sama = .wi=1n wi 1n2Σni=1Var(xi)
Berikut adalah beberapa contoh hasil numerik:
Tentu saja, mungkin untuk mean tertimbang untuk memiliki varian yang lebih besar dari rata-rata tidak tertimbang, jika bobot dipilih dengan cara yang buruk. Dengan memilih bobot 1 pada titik data dengan varians terbesar, dan 0 untuk semua poin data lainnya, mean tertimbang akan memiliki varians = varians terbesar dari setiap titik data. Contoh ekstrem ini akan menjadi hasil dari memaksimalkan daripada meminimalkan dalam masalah optimasi yang saya paparkan.
sumber
Ini adalah contoh sederhana menggunakan dan bentuk varians:1n∑i(xi−1n∑jxj)2 1∑kwk∑iwi(xi−1∑kwk∑jwjxj)2
Misalkan populasi Anda memiliki ukuran .20,30,40,50
Contoh ini konsisten dengan komentar saya bahwa kutipan ahli statistik Anda mungkin benar untuk populasi dengan distribusi unimodal, meskipun secara umum tidak perlu benar.
Saya kira intinya adalah bahwa jika Anda mengutip mean tertimbang, Anda mungkin harus mengaitkannya dengan varian tertimbang. Jika sebenarnya mean Anda adalah hasil sampel, kesalahan standar rata-rata sampel tertimbang adalah perhitungan yang lebih rumit.
sumber