Apakah rata-rata dari seperangkat rata-rata selalu sama dengan rata-rata yang diperoleh dari seluruh set data mentah?

11

Jika saya telah menghitung rata-rata untuk 4 set data (yang memang memiliki ukuran sampel berbeda), dapatkah saya memperoleh "rata-rata keseluruhan" dengan menghitung "rata-rata rata-rata"? Jika ya, apakah "rata-rata rata-rata" ini sama dengan jika saya telah menggabungkan data dari keempat set dan kemudian menghitung rata-rata?

pengguna66429
sumber
3
Apakah Anda sudah mencoba keduanya ;-)? (No.)
gung - Reinstate Monica

Jawaban:

14

Tidak, rata-rata dari rata-rata himpunan bagian tidak sama dengan rata-rata seluruh rangkaian. Ini hanya akan menjadi nilai yang sama jika himpunan bagian ukuran sampel yang sama. Jika Anda ingin rata-rata populasi, gandakan setiap rata-rata dengan ukuran sampel asalnya untuk mendapatkan total populasi, kemudian bagi dengan jumlah total poin data (ukuran populasi).

Lihat contoh rata-rata pukulan pada paradoks Simpson untuk ilustrasi yang baik tentang mengapa rata-rata rata-rata biasanya tidak berfungsi.

Bill the Lizard
sumber
2

Mari kita coba dan lihat apakah kita bisa mengetahuinya. Contoh berikut ini diberi kode R, yang gratis dan akan memungkinkan Anda mereproduksi contoh, tetapi mudah-mudahan kode ini cukup jelas:

group1 = c(1,2,3)
group2 = c(4,5,6,7,8,9)
mean(group1)
#  2
mean(group2)
#  6.5
mean(c(group1, group2))
#  5
mean(c(mean(group1), mean(group2)))
#  4.25

Jadi yang kami lihat adalah Anda tentu bisa menghitung mean dari mean, tetapi mean dari mean dan mean dari semua data mentah tidak cocok. Kami juga dapat mencoba rata - rata tertimbang menggunakan saran @ BilltheLizard untuk menggunakan ukuran sampel masing-masing kelompok sebagai bobot (bobot ditunjukkan dengan wargumen):

weighted.mean(c(mean(group1), mean(group2)), w=c(3,6))
#  5

Ini sekarang memberi kita jawaban yang sama.

gung - Pasang kembali Monica
sumber
1

Secara umum, jika Anda memiliki satu set m grup dengan ukuran masing-masing n1,...,nm dan sarana x¯1,...,x¯m maka rata-rata sampel keseluruhan dari semua data adalah:

x¯=k=1mnknx¯kn=i=1mnk.

Dengan demikian, rata-rata keseluruhan selalu rata - rata tertimbang dari rata - rata sampel kelompok. Dalam kasus khusus di mana semua grup memiliki ukuran yang sama (n1==nm), semua bobot akan sama dan demikian, rata-rata sampel keseluruhan akan menjadi rata-rata dari mean sampel kelompok.

Ben - Pasang kembali Monica
sumber
0

Hanya ingin memberikan contoh (ekstrem): jika kita memiliki hit rate (1/10000) dalam satu sampel, dan hit rate (1/2) pada contoh lain, maka hititotalihititotali. Dalam kasus pertama (rata-rata berarti), kami memiliki tingkat hit "rata-rata" 0,5001 / 2 sedangkan dalam kasus kedua (rata-rata total) kami memiliki 3/10003, dan dua angka ini tidak sama. Apakah satu lebih tepat atau benar tergantung pada kasus penggunaan Anda.

pertukaran informasi
sumber