Jika saya telah menghitung rata-rata untuk 4 set data (yang memang memiliki ukuran sampel berbeda), dapatkah saya memperoleh "rata-rata keseluruhan" dengan menghitung "rata-rata rata-rata"? Jika ya, apakah "rata-rata rata-rata" ini sama dengan jika saya telah menggabungkan data dari keempat set dan kemudian menghitung rata-rata?
mathematical-statistics
weighted-mean
mean
pengguna66429
sumber
sumber
Jawaban:
Tidak, rata-rata dari rata-rata himpunan bagian tidak sama dengan rata-rata seluruh rangkaian. Ini hanya akan menjadi nilai yang sama jika himpunan bagian ukuran sampel yang sama. Jika Anda ingin rata-rata populasi, gandakan setiap rata-rata dengan ukuran sampel asalnya untuk mendapatkan total populasi, kemudian bagi dengan jumlah total poin data (ukuran populasi).
Lihat contoh rata-rata pukulan pada paradoks Simpson untuk ilustrasi yang baik tentang mengapa rata-rata rata-rata biasanya tidak berfungsi.
sumber
Mari kita coba dan lihat apakah kita bisa mengetahuinya. Contoh berikut ini diberi kode
R
, yang gratis dan akan memungkinkan Anda mereproduksi contoh, tetapi mudah-mudahan kode ini cukup jelas:Jadi yang kami lihat adalah Anda tentu bisa menghitung mean dari mean, tetapi mean dari mean dan mean dari semua data mentah tidak cocok. Kami juga dapat mencoba rata - rata tertimbang menggunakan saran @ BilltheLizard untuk menggunakan ukuran sampel masing-masing kelompok sebagai bobot (bobot ditunjukkan dengan
w
argumen):Ini sekarang memberi kita jawaban yang sama.
sumber
Secara umum, jika Anda memiliki satu setm grup dengan ukuran masing-masing n1,...,nm dan sarana x¯1,...,x¯m maka rata-rata sampel keseluruhan dari semua data adalah:
Dengan demikian, rata-rata keseluruhan selalu rata - rata tertimbang dari rata - rata sampel kelompok. Dalam kasus khusus di mana semua grup memiliki ukuran yang sama (n1=⋯=nm ), semua bobot akan sama dan demikian, rata-rata sampel keseluruhan akan menjadi rata-rata dari mean sampel kelompok.
sumber
Hanya ingin memberikan contoh (ekstrem): jika kita memiliki hit rate (1/10000) dalam satu sampel, dan hit rate (1/2) pada contoh lain, maka∑hititotali≠∑hiti∑totali . Dalam kasus pertama (rata-rata berarti), kami memiliki tingkat hit "rata-rata" 0,5001 / 2 sedangkan dalam kasus kedua (rata-rata total) kami memiliki 3/10003, dan dua angka ini tidak sama. Apakah satu lebih tepat atau benar tergantung pada kasus penggunaan Anda.
sumber