Dalam data miring kiri, apa hubungan antara rata-rata dan median?

12

Saya pikir median berarti.

Apakah ini masalahnya?

Kunjan Kshetri
sumber
2
Kursus MOOC terbuka apa itu? Apa yang disarankan oleh materi pelajaran jawabannya?
Glen_b -Reinstate Monica
1
class.stanford.edu/courses/Medicine/HRP258/… . Kursus berakhir.
Kunjan Kshetri
1
Terima kasih, setidaknya itulah konteksnya, meskipun yang tersisa hanyalah bacaan mingguan yang tidak terlalu mempermasalahkan masalah ini. Saya benar-benar bertanya-tanya apa yang dikatakan oleh kursus tentang topik tersebut.
Glen_b -Reinstate Monica

Jawaban:

16

Ini adalah pertanyaan yang tidak trivial (pasti tidak sepele seperti yang dipikirkan oleh orang-orang yang mengajukan pertanyaan).

Kesulitan pada akhirnya disebabkan oleh kenyataan bahwa kita tidak benar-benar tahu apa yang kita maksudkan dengan 'kecondongan' - sering kali itu agak jelas, tetapi kadang-kadang tidak. Mengingat sulitnya menjabarkan apa yang kami maksud dengan 'lokasi' dan 'menyebar' dalam kasus nontrivial (misalnya, rata-rata tidak selalu seperti yang kita maksudkan ketika kita berbicara tentang lokasi), seharusnya bukan kejutan besar bahwa yang lebih halus Konsep seperti skewness setidaknya sama licinnya. Jadi ini mengarahkan kita untuk mencoba berbagai definisi aljabar tentang apa yang kita maksudkan, dan mereka tidak selalu setuju satu sama lain.

1) Jika Anda mengukur skewness dengan koefisien skewness Pearson kedua , maka rata-rata ( ) akan lebih kecil dari median ( μ - yaitu dalam hal ini Anda memiliki kemiringan mundur).μμ

Skewness Pearson (populasi) kedua adalah dan akan menjadi negatif ("condong ke kiri") ketika μ < μ .

3(μμ)σ,
μ<μ

Versi contoh statistik ini bekerja dengan cara yang sama.

Alasan untuk hubungan yang diperlukan antara rata-rata dan median dalam kasus ini adalah karena begitulah cara mengukur kemiringan didefinisikan.

Berikut adalah kerapatan miring kiri (berdasarkan ukuran Pearson kedua dan ukuran yang lebih umum pada (2) di bawah):

masukkan deskripsi gambar di sini

Median ditandai di margin bawah di hijau, rata-rata di merah.

Jadi saya berharap jawaban yang ingin Anda berikan adalah rata-rata kurang dari median. Biasanya demikian halnya dengan jenis distribusi yang cenderung kita beri nama.

(Tapi baca terus, dan lihat mengapa itu tidak benar sebagai pernyataan umum.)


2) Jika Anda mengukurnya dengan momen ketiga terstandarisasi yang lebih biasa , maka sering, tetapi tidak berarti selalu, kasus bahwa mean akan kurang dari median.

Yaitu, mungkin untuk membuat contoh di mana yang sebaliknya benar, atau di mana satu ukuran kemiringan adalah nol sedangkan yang lain adalah bukan-nol.

Artinya, tidak ada hubungan yang diperlukan antara lokasi mean, median dan kemiringan momen.

Pertimbangkan, misalnya, sampel berikut (contoh yang sama dapat dibangun sebagai distribusi probabilitas diskrit):

  2.7 15.0 15.0 15.0 30.0 30.0

mean: 17.95
median: 15

Namun koefisien skewness (Fisher, momen ketiga) adalah negatif (yaitu dengan cahayanya, kami memiliki data condong kiri) karena jumlah kubus penyimpangan dari mean adalah negatif.

Jadi dalam hal ini, condong ke kiri, tetapi berarti> median.

(Di sisi lain, jika Anda mengubah 2,7 pada contoh di atas menjadi 3, maka Anda memiliki contoh di mana kemiringan momen adalah nol, namun mean melebihi median. Jika Anda membuatnya 3,3, maka kemewahan momen adalah positif. , dan rata-rata melebihi median - yaitu akhirnya dalam arah yang 'diantisipasi'.)

Jika Anda menggunakan kemiringan Pearson pertama alih-alih salah satu dari definisi di atas, Anda memiliki masalah yang serupa dengan kasus ini - arah kemiringan tidak menunjukkan hubungan antara rata-rata dan median pada umumnya.


Sunting: dalam menjawab pertanyaan dalam komentar - contoh di mana rata-rata dan mediannya sama, tetapi kemiringan momennya negatif. Pertimbangkan data berikut (seperti sebelumnya, itu juga dianggap sebagai contoh untuk populasi yang terpisah; pertimbangkan untuk menuliskan angka-angka pada wajah dadu).

 1  5  6  6  8 10

rata-rata dan median keduanya 6, tetapi jumlah kubus penyimpangan dari rata-rata adalah negatif, sehingga kemiringan momen ketiga negatif.

Glen_b -Reinstate Monica
sumber
1
@ Peter Maaf atas jawaban lambat, saya sibuk membangun hanya contoh-contoh seperti itu dan tidak melihat pertanyaan Anda.
Glen_b -Reinstate Monica
2
Saya telah melihat banyak definisi buku teks dan tidak ada yang menyebutkan ini. Keren.
Peter Flom - Reinstate Monica
6
@ Peter Sayangnya, banyak buku pelajaran dasar hanya mengulangi informasi yang salah dari buku teks lain tanpa benar-benar melakukan penyelidikan nyata sendiri, dan kesalahpahaman dasar akan diperbanyak. Contoh tandingan, seperti yang Anda lihat, relatif mudah dibangun (saya hanya membuatnya dengan tangan sesuai kebutuhan). Kendall dan Stuart ( Teori Statistik Lanjutan, Vol I - jangan biarkan judul itu membuat Anda marah, itu cukup mudah dibaca), setidaknya edisi ketiga dan keempat, memiliki informasi yang baik. Edisi yang lebih baru adalah oleh Stuart dan Ord. Saya sebenarnya telah memposting tentang masalah ini di CV beberapa kali.
Glen_b -Reinstate Monica
4
(5k)0.8k0.25k(5k)0.2k0.85k=
1
@Nick Ya, binomial dengan rata-rata integer adalah contoh yang bagus.
Glen_b -Reinstate Monica
5

Tidak. Data condong kiri memiliki ekor panjang di sebelah kiri (ujung bawah) sehingga rata-rata biasanya akan kurang dari median. (Tapi lihat jawaban @Glen_b untuk pengecualian). Dengan santai, saya pikir data yang "tampak" condong ke kiri berarti kurang dari median.

Data miring kanan lebih umum; misalnya, penghasilan. Di sana rata-rata lebih besar dari median.

Kode r

set.seed(123)  #set random seed
normdata <- rnorm(1000) #Normal data, skew = 0
extleft <- c(rep(-10, 5), rep(-20, 5)) #Some data to make skew left
alldata <- c(normdata,extleft)

library(moments)
skewness(alldata) #-6.77
mean(alldata) #-0.13
median(alldata) #-0.001
Peter Flom - Pasang kembali Monica
sumber
Bisakah rata-rata sama dengan median?
Kunjan Kshetri
unj2 Saya menambahkan contoh untuk jawaban saya di mana kemiringan momen ketiga negatif tetapi berarti = median.
Glen_b -Reinstate Monica