Hubungan empiris antara mean, median dan mode

40

Untuk distribusi unimodal yang cukup miring, kami memiliki hubungan empiris berikut antara rata-rata, median dan mode: Bagaimana hubungan ini berasal?

(Mean - Mode)3(Berarti - Median)

Apakah Karl Pearson merencanakan ribuan hubungan ini sebelum membentuk kesimpulan ini, atau adakah garis logis alasan di balik hubungan ini?

Sara
sumber

Jawaban:

29

Nyatakan mean ( rata-rata), m median, σ simpangan baku dan M mode. Akhirnya, biarkan X menjadi sampel, realisasi distribusi unimodal terus menerus F yang kedua saat pertama ada.μmσM.XF

Sudah terkenal itu

(1)|μ-m|σ

Ini adalah latihan buku teks yang sering:

Kesetaraan pertama berasal dari definisi rata-rata, yang ketiga muncul karena median adalah pengecil unik (di antara semuac) dariE| X-c| dan yang keempat dari ketidaksetaraan Jensen (yaitu definisi fungsi cembung). Sebenarnya, ketidaksetaraan ini bisa diperketat. Bahkan, untukFapa pun, memenuhi persyaratan di atas, dapat ditunjukkan [3] itu

|μm|=|E(Xm)|E|Xm|E|Xμ|=E(Xμ)2E(Xμ)2=σ
cE|Xc|F

(2)|m-μ|0,6σ

Meskipun secara umum tidak benar ( Abadir, 2005 ) bahwa setiap distribusi unimodal harus memenuhi salah satu dari masih dapat ditunjukkan bahwa ketimpangan

M.mμ atau M.mμ

(3)|μM|3σ

berlaku untuk distribusi unimodal, persegi yang dapat diintegrasikan (terlepas dari kemiringan). Ini dibuktikan secara formal dalam Johnson dan Rogers (1951) meskipun buktinya tergantung pada banyak lemma tambahan yang sulit untuk dimasukkan di sini. Pergi melihat kertas aslinya.


Kondisi yang memadai untuk distribusi untuk memenuhi μ m M diberikan dalam [2]. Jika F :FμmMF

(4)F(mx)+F(m+x)1 for all x

maka . Selanjutnya, jika μ m , maka ketimpangannya sangat ketat. Distribusi Pearson Tipe I ke XII adalah salah satu contoh keluarga distribusi yang memuaskan ( 4 ) [4] (misalnya, Weibull adalah salah satu distribusi umum yang ( 4 ) tidak berlaku, lihat [5]).μmMμm(4)(4)

Sekarang dengan asumsi bahwa memegang teguh dan wlog bahwa σ = 1 , kita memiliki 3 ( m - μ ) ( 0 , 3 (4)σ=1

3(mμ)(0,30.6] and Mμ(mμ,3]

dan karena yang kedua dari dua rentang ini tidak kosong, tentu mungkin untuk menemukan distribusi yang pernyataannya benar (misalnya ketika ) untuk beberapa rentang nilai parameter distribusi tetapi tidak benar untuk semua distribusi dan bahkan tidak untuk semua distribusi yang memuaskan(4).0<mμ<33<σ=1(4)

  • [0]: Masalah Momen untuk Distribusi Unimodal. NL Johnson dan CA Rogers. The Annals of Statistics Matematika, Vol. 22, No. 3 (Sep., 1951), hlm. 433-439
  • [1]: Ketimpangan Median-Mode-Rata: Contoh tandingan Karim M. Abadir Teori Ekonometrika, Vol. 21, No. 2 (Apr., 2005), hlm. 477-482
  • [2]: WR van Zwet, Mean, median, mode II, Statist. Neerlandica, 33 (1979), hlm. 1--5.
  • [3]: Mean, Median, dan Mode Distribusi Unimodal: Karakterisasi. S. Basu dan A. DasGupta (1997). Teori Probab. Appl., 41 (2), 210–223.
  • [4]: Beberapa Keterangan Tentang Mean, Median, Mode Dan Skewness. Michikazu Sato. Jurnal Statistik Australia. Volume 39, Edisi 2, halaman 219–224, Juni 1997
  • [5]: PT von Hippel (2005). Berarti, Median, dan Miring: Memperbaiki Aturan Buku Teks. Jurnal Statistik Pendidikan Volume 13, Nomor 2.
pengguna603
sumber
Maaf, saya hanya siswa matematika tahun pertama. Bisakah Anda memberikan / merekomendasikan tautan / buku / kertas yang menjelaskan bagaimana hubungan itu diturunkan?
Sara
3
@Sara Saya pikir itu tanggal kembali ke Karl Pearson, yang menggunakan hubungan empiris ini untuk "kemiringan mode Pearson". Selain itu, Anda mungkin menemukan artikel online yang menarik ini, j.mp/aWymCv .
chl
Terima kasih chl dan kwak untuk tautannya dan jawaban yang Anda berikan. Saya akan mempelajarinya.
Sara
2
Berbagai poin: diminimalkan ketika k adalah median dari X . Artikel Von Hippel (ditautkan di atas oleh chl) membahas pengecualian dan btinternet.com/~se16/hgb/median.htm menunjukkan kemungkinan hubungan antara mean, median, mode dan standar deviasi, baik untuk distribusi kontinu maupun terpisah. 3 sebenarnya bisa mengambil nilai apa pun: positif, negatif, nol atau tak terbatas. E|Xk|kX
Henry
1
Mungkin saya menjadi sedikit padat (ini bukan pertama kalinya). Bisakah Anda mengklarifikasi caranya mengikuti dari (1) dan (3)? |Mμ|3|μm|
Glen_b -Reinstate Monica
9

Paper chl menunjuk untuk memberikan beberapa informasi penting - menunjukkan bahwa itu tidak dekat dengan aturan umum (bahkan untuk variabel kontinu, mulus, "berperilaku baik", seperti Weibull). Jadi, meskipun mungkin kira-kira benar, namun seringkali tidak.

Jadi dari mana Pearson berasal? Bagaimana dia sampai pada perkiraan ini?

Untungnya, Pearson cukup banyak memberi tahu kita jawabannya sendiri.

Penggunaan pertama dari istilah "condong" dalam arti yang kita gunakan tampaknya adalah Pearson, 1895 [1] (tampaknya tepat di judul). Makalah ini juga tampaknya menjadi tempat ia memperkenalkan istilah mode (catatan kaki, hal345):

Saya merasa nyaman menggunakan istilah ini mode untuk absis yang sesuai dengan ordinat frekuensi maksimum. The "mean," the "mode," dan "median" memiliki semua karakter berbeda yang penting bagi ahli statistik.

Ini juga tampaknya merupakan perincian nyata pertamanya dari sistem kurva frekuensinya .

Jadi dalam membahas estimasi parameter bentuk di Pearson distribusi Type III (apa yang sekarang kita sebut bergeser - dan mungkin terbalik - gamma), katanya (hal375):

p

>1

x

Dan memang, jika kita melihat rasio (mean-mode) ke (mean-median) untuk distribusi gamma, kami mengamati ini:

masukkan deskripsi gambar di sini

(Bagian biru menandai wilayah Pearson mengatakan bahwa perkiraannya masuk akal).

αβ

masukkan deskripsi gambar di sini

β-α=kβ-ααβ-ααββ+α=cβ+ααβ

α>10):

masukkan deskripsi gambar di sini

Seharusnya Pearson juga akrab dengan distribusi lognormal. Dalam hal ini mode, median dan mean masing-masingeμ-σ2,eμ dan eμ+σ2/2; itu dibahas sebelum pengembangan sistemnya dan sering dikaitkan dengan Galton.

Mari kita lihat lagi (mean-mode) / (mean-median). Membatalkan faktor darieμ baik dari pembilang dan penyebut, kita pergi dengan eσ2/2-e-σ2eσ2/2-1. Untuk urutan pertama (yang akan akurat kapanσ2 kecil), pembilangnya akan 32σ2 dan penyebutnya 12σ2, jadi setidaknya untuk yang kecil σ2 seharusnya juga berlaku untuk lognormal.

Ada cukup banyak distribusi terkenal - beberapa di antaranya Pearson kenal - yang hampir benar untuk berbagai nilai parameter; dia memperhatikannya dengan distribusi gamma, tetapi gagasan itu akan dikonfirmasi ketika dia datang untuk melihat beberapa distribusi lain yang mungkin akan dia pertimbangkan.

[1]: Pearson, K. (1895),
"Kontribusi Teori Matematika Evolusi, II: Variasi Kecondongan dalam Bahan yang Homogen,"
Transaksi Filsafat Masyarakat Kerajaan, Seri A, 186, 343-414
[Tidak Ada Hak Cipta. Tersedia secara bebas di sini ]

Glen_b -Reinstate Monica
sumber
4

Hubungan ini tidak diturunkan. Itu diketahui sekitar memegang distribusi simetris dekat secara empiris . Lihat paparan Yule dalam The Introduction to the the theory of statistics , (1922), hal.121, Bab VII Bagian 20. Dia menyajikan contoh empiris.

Aksakal
sumber
+1 Memang, kutipan saya tentang Pearson 1895 menunjukkan bahwa itu adalah sesuatu yang dia perhatikan alih-alih berasal.
Glen_b -Reinstate Monica
2
Teks matematika lama jauh lebih menyenangkan untuk dibaca daripada tulisan hari ini
Aksakal