Menjelaskan Mean, Median, Mode dalam Ketentuan Layman

10

Bagaimana Anda akan menjelaskan konsep mean, median, dan mode daftar angka dan mengapa mereka penting bagi seseorang dengan hanya keterampilan aritmatika dasar? Jangan menyebutkan kemiringan, CLT, kecenderungan sentral, sifat statistiknya, dll.

Saya telah menjelaskan kepada seseorang bahwa maksudnya hanyalah cara cepat dan kotor untuk "meringkas" daftar angka. Tapi melihat ke belakang, ini hampir tidak mencerahkan.

Adakah pemikiran atau contoh dunia nyata?

Kepedulian Warga
sumber
Mereka adalah "kecenderungan utama", alias "hasil yang paling mungkin" di domain yang berbeda. Intensitas, ketertiban, dan frekuensi, khususnya. Dunia nyata juga memiliki variasi - sehingga hal-hal seperti standar deviasi, kisaran antar-kuartil (atau kuantil), dan jangkauan antar-modal juga cukup berguna karena mereka menunjukkan "kecenderungan variasi" atau "variasi khas dalam hasil".
EngrStudent
Anda dapat memberikan contoh bahwa ada mesin yang menghasilkan angka secara acak. Anda mengumpulkan semua angka yang dihasilkannya dalam daftar. Anda sekarang ingin mempresentasikannya kepada teman-teman Anda tanpa mengutip setiap nomor dalam daftar. Dengan demikian Anda mencari ukuran yang dapat membantu Anda menggambarkannya. Mean / Median / Mode adalah tiga ukuran serupa yang memberikan wawasan tentang sifat-sifat dasar mesin.
Kevin Pei
@KevinPei Tapi apa artinya "artinya" dalam kasus ini? Mean / Median / Mode tidak menjelaskan banyak dalam contoh yang dibuat sendiri, mandiri.
Concerned_Citizen
1
Finding mean adalah masalah menemukan titik pivot yang menyeimbangkan jungkat-jungkit setelah anak-anak (dengan berat yang sama) mulai menggunakannya dalam jumlah sewenang-wenang dan pada posisi sewenang-wenang pada balok. Menemukan median adalah tugas yang sama, hanya anak-anak dikatakan mengelompok ketat hanya dalam dua posisi baik di sisi "ini" atau "itu".
ttnphns
Anda tidak dapat menjelaskan ini tanpa gagasan distribusi. Dengan hanya keterampilan aritmatika dasar Anda harus menggambar.
Aksakal

Jawaban:

6

Terima kasih atas pertanyaan sederhana namun mendalam tentang konsep statistik dasar mean, median, dan mode. Ada beberapa metode / demonstrasi luar biasa yang tersedia untuk menjelaskan dan memahami pemahaman intuitif - daripada aritmatika - konsep ini, tetapi sayangnya mereka tidak dikenal secara luas (atau diajarkan di sekolah, setahu saya).

Berarti:

1. Balance Point: Berarti sebagai titik tumpu

Cara terbaik untuk memahami konsep berarti menganggapnya sebagai titik keseimbangan pada batang seragam. Bayangkan serangkaian titik data, seperti {1,1,1,3,3,6,7,10}. Jika masing-masing titik ditandai pada batang yang seragam dan bobot yang sama ditempatkan pada setiap titik (seperti yang ditunjukkan di bawah) maka titik tumpu harus ditempatkan pada rata-rata data agar batang seimbang.

masukkan deskripsi gambar di sini

Demonstrasi visual ini juga mengarah pada interpretasi aritmatika. Alasan aritmatika untuk ini adalah bahwa agar titik tumpu seimbang, total deviasi negatif dari rata-rata (di sisi kiri titik tumpu) harus sama dengan total deviasi positif dari nilai rata-rata (di sisi kanan). Karenanya, mean bertindak sebagai titik penyeimbang dalam suatu distribusi.

Visual ini memungkinkan pemahaman langsung tentang rata-rata karena berkaitan dengan distribusi titik data. Properti lain dari rata-rata yang menjadi jelas dari demonstrasi ini adalah fakta bahwa rata-rata akan selalu berada di antara nilai minimum dan maksimum dalam distribusi. Juga, efek outlier dapat dengan mudah dipahami - bahwa kehadiran outlier akan menggeser titik penyeimbang, dan karenanya, berdampak pada rata-rata.

2. Nilai redistribusi (bagian yang adil)

Cara lain yang menarik untuk memahami nilai tengah adalah dengan menganggapnya sebagai nilai redistribusi . Penafsiran ini memang memerlukan beberapa pemahaman tentang aritmatika di balik perhitungan rata-rata, tetapi ia menggunakan kualitas antropomorfik - yaitu, konsep redistribusi sosialis - untuk secara intuitif memahami konsep rata-rata.

Penghitungan rata-rata melibatkan penjumlahan semua nilai dalam distribusi (set nilai) dan membagi jumlah dengan jumlah titik data dalam distribusi.

x¯=(i=1nxi)/n

Salah satu cara untuk memahami alasan di balik perhitungan ini adalah dengan menganggap setiap titik data sebagai apel (atau item sepadan lainnya). Dengan menggunakan contoh yang sama seperti sebelumnya, kami memiliki delapan orang dalam sampel kami: {1,1,1,3,3,6,7,10}. Orang pertama memiliki satu apel, orang kedua memiliki satu apel, dan seterusnya. Sekarang, jika seseorang ingin mendistribusikan kembali jumlah apel sehingga itu "adil" untuk semua orang, Anda dapat menggunakan rata-rata distribusi untuk melakukan ini. Dengan kata lain, Anda dapat memberikan empat apel (yaitu, nilai rata-rata) kepada semua orang agar distribusinya adil / sama. Demonstrasi ini memberikan penjelasan intuitif untuk rumus di atas: membagi jumlah distribusi dengan jumlah titik data setara dengan mempartisi seluruh distribusi secara merata ke semua titik data.

3. Visual Mnemonics

Mnemonik visual berikut ini menyediakan interpretasi mean dengan cara yang unik:

masukkan deskripsi gambar di sini

Ini adalah mnemonik untuk interpretasi nilai leveling dari rata-rata. Tinggi palang A adalah rata-rata ketinggian empat huruf.

masukkan deskripsi gambar di sini

Dan ini adalah mnemonik lain untuk interpretasi titik keseimbangan dari rata-rata. Posisi titik tumpu kira-kira rata-rata dari posisi M, E, dan dua kali lipat N.

Median

Setelah interpretasi mean sebagai titik penyeimbang pada tongkat dipahami, median dapat ditunjukkan dengan perpanjangan dari ide yang sama: titik penyeimbang pada kalung .

Ganti batang dengan string, tetapi simpan tanda dan bobot data. Kemudian di ujungnya, pasang tali kedua, lebih panjang dari yang pertama, untuk membentuk lingkaran [seperti kalung], dan menggantungkan loop di atas katrol yang dilumasi dengan baik.

masukkan deskripsi gambar di sini

Anggaplah, awalnya, bahwa bobotnya berbeda. Katrol dan keseimbangan loop ketika jumlah bobot yang sama adalah untuk setiap sisi. Dengan kata lain, loop 'menyeimbangkan' ketika median adalah titik terendah.

Perhatikan bahwa jika salah satu dari bobot tersebut meluncur ke atas loop menciptakan pencilan, loop tidak bergerak. Ini menunjukkan, secara fisik, prinsip bahwa median tidak terpengaruh oleh outlier.

Mode

Mode ini mungkin konsep yang paling mudah untuk dipahami karena melibatkan operasi matematika paling dasar: berhitung. Fakta bahwa itu sama dengan data titik lead yang paling sering terjadi untuk akronim: “ M ost-sering O ccurring D ata E lement”.

Mode ini juga dapat dianggap sebagai nilai paling umum dalam satu set. (Meskipun, pemahaman yang lebih dalam tentang 'tipikal' akan mengarah pada perwakilan, atau nilai rata-rata. Namun, pantas untuk menyamakan 'tipikal' dengan mode berdasarkan arti yang sangat harfiah dari kata 'tipikal'.)


Sumber:

  • Median adalah titik keseimbangan - Lynch, The College Mathematics Journal (2009)
  • Membuat Statistik Berkesan: Mnemonik dan Motivasi Baru - Lesser, Education Statistics, JSM (2011)
  • Tentang Penggunaan Mnemonik untuk Mengajar Statistik - Lesser, Model Assisted Statistics and Applications, 6 (2), 151-160 (2011)
  • Apa maksudnya? - Watier, Lamontagne and Chartier, Jurnal Pendidikan Statistik, Volume 19, Nomor 2 (2011)
  • Khas? Gagasan Anak-Anak dan Guru Tentang Rata-Rata - Russell dan Mokros, ICOTS 3 (1990) REFERENSI KESELURUHAN: http://www.amstat.org/publications/jse/v22n3/lesser.pdf
Vishal
sumber
Baru saja menemukan artikel ini hari ini yang memberi penjelasan
Vishal
1
Seorang pengguna anonim menyarankan referensi keseluruhan berikut juga: amstat.org/publications/jse/v22n3/lesser.pdf
gung
3

Saya harus bertanya-tanya apakah kriteria Anda dapat dicapai karena Anda tampaknya ingin efektivitas maksimal dan kekuatan penjelas dengan bahan minimal. Tetapi contoh sederhana seperti

1 1 2 2 2 3 3 4 5 6 15

memungkinkan perhitungan langsung dari mode (2), median (3) dan rata-rata (44/11) = 4 dan dengan demikian menunjukkan bahwa mereka dapat berbeda.

Anda kemudian dapat menjelaskan bahwa ide - ide dari nilai yang paling umum, nilai di tengah dan rata-rata berbeda. Dan memperkenalkan komplikasi oleh

  1. mengubah nilai untuk menunjukkan mode bisa ambigu

  2. menggunakan contoh dengan jumlah nilai genap untuk menjelaskan konvensi untuk menghitung median

  3. berbagai nilai pada bagian ekor untuk menekankan apa yang terjadi pada nilai rata-rata, dan mengapa dan mengapa tidak hal itu mungkin diinginkan.

  4. menggunakan contoh-contoh sederhana di mana dua atau tiga mode rata-rata, rata-rata bertepatan.

Saya belum menyebutkan kecenderungan utama dalam pengajaran saya kecuali untuk mengatakan bahwa itu adalah istilah dalam berbagai literatur. Saya lebih suka berbicara tentang level dan bagaimana mengukurnya. Sebaliknya, saya tidak berpikir analisis data serius apa pun mungkin dilakukan kecuali orang memiliki perasaan minimal terhadap kemiringan seperti lebih biasa daripada simetri.

Nick Cox
sumber
Ya, menyesuaikan nilai akan mengubah statistik ringkasan tetapi tetap apa yang dimaksud dengan "sendiri"?
Concerned_Citizen
1
perhitungan pengertian
shadowtalker
1
Apa itu merah ? Kita tidak selalu perlu tahu definisi untuk menggunakan ide. Pemahaman yang baik tentang merah mungkin membutuhkan fisika, fisiologi, dan psikologi, tetapi saya tidak pernah membutuhkannya. Saya tahu banyak tentang cara kerja rata-rata, tetapi pada satu tingkat mendasar definisi tersebut hanyalah rumusnya.
Nick Cox
1
@NickCox sangat adil dan sangat benar. tetapi pengalaman saya di perguruan tinggi masih sangat baru, dan saya ingat terlalu banyak masalah di mana saya membabi buta menghitung jawaban tanpa memahami apa yang saya hitung atau mengapa saya melakukannya
shadowtalker
1
@ssdecontrol Itu tidak pernah berhenti terjadi sepenuhnya ...
Nick Cox
3

Beginilah cara saya menjelaskannya:

Mean (aritmatika) adalah titik yang mengambil seluruh data yang ditetapkan, dan menetap di suatu tempat "di tengah." Mintalah mereka memikirkan awan titik, atau gumpalan, di ruang angkasa: mean adalah pusat massa dari awan titik itu.

The median adalah titik yang memiliki "jumlah poin yang sama di semua sisi" (di mana jelas konsep "sisi" tidak didefinisikan dengan baik di 2+ dimensi). Ini mewakili jenis "tengah" yang lain, dan sebenarnya jenis yang lebih intuitif dalam beberapa hal. Memikirkan gumpalan yang sama di ruang angkasa, jelas bahwa jika gumpalan itu miring, maka rata-rata akan bergeser. Tetapi ketidakseimbangan ini dapat dicapai dengan salah satu dari dua cara: Anda menambahkan lebih banyak poin di satu area, atau meningkatkan dispersi poin di area tersebut. Jika Anda meningkatkan dispersi poin dalam satu area tanpa meningkatkan jumlah poin, maka median masih memiliki jumlah poin yang sama "di semua sisi" dan tidak akan bergeser sepadan dengan rata-rata.

Anda dapat menunjukkan ini dengan dua "gumpalan" yang sangat sepele: dan . , sedangkan . Tapi saya sarankan mulai dengan penjelasan geometris / visual "berbasis gumpalan" pertama: dalam pengalaman saya lebih mudah untuk memulai dengan demonstrasi grafis tangan-melambaikan, kemudian pindah ke contoh mainan beton. Saya menemukan bahwa kebanyakan orang (termasuk saya sendiri) tidak berorientasi pada angka, dan memulai dengan penjelasan numerik adalah resep untuk kebingungan. Anda selalu dapat kembali dan mengajarkan definisi yang lebih tepat nanti.y = ( 1 , 2 , 3 , 4 , 99 ) rata-rata ( y ) = median ( y ) rata-rata ( y ) > median ( y )y=(1,2,3,4,5)y=(1,2,3,4,99)mean(y)=median(y)mean(y)>median(y)

The Modus adalah titik itu, jika poin secara acak sampel dari gumpalan itu, adalah paling mungkin muncul (mengakui bahwa ini adalah fudge untuk data kontinu). Ini bisa, tetapi tidak harus, terletak di dekat mean atau median.

Setelah Anda menjelaskan konsep-konsep ini, maka Anda dapat beralih ke demo yang lebih "tampak statistik":

demo

Garis solid adalah rerata. Garis putus-putus adalah median. Garis putus-putus adalah mode. Rerata mewakili posisi titik data sepanjang sumbu x, sedangkan median hanya mencerminkan jumlah titik data di kedua sisi. Mode hanyalah titik probabilitas terbesar, yang berbeda dari rata-rata dan median.

Kode R:

set.seed(47730)
y <- rgamma(100, 2, 2)
d <- density(y)
plot(d)
rug(y)
abline(v = mean(y), lty = 1)
abline(v = median(y), lty = 2)
abline(v = d$x[which.max(d$y)], lty = 3)
shadowtalker
sumber
Penjelasan yang baik, tetapi sebenarnya ini mengasumsikan lebih dari "keterampilan aritmatika dasar": pemikiran geometris, mekanika dasar, pengambilan sampel acak, teori probabilitas (termasuk fungsi kerapatan) semuanya digunakan di sini. Itu adalah komentar, tidak dimaksudkan sebagai kritik knock-down, karena saya pikir pertanyaannya sangat sulit.
Nick Cox
@NickCox poin bagus pasti. Tetapi sekarang setelah saya memikirkannya, saya berdiri dengan menggunakannya, karena mereka semua dapat dijelaskan tanpa matematika (misalnya penjelasan "lihat-lihat" oleh ttnphns dalam komentar pada pertanyaan utama), atau mereka sudah dipahami secara intuitif pada tingkat tertentu oleh banyak orang. Kepadatannya sedikit jangkauan, tapi saya rasa Anda tidak perlu pergi ke sana
shadowtalker
(@ttnphns: memberi tag Anda jika Anda ingin mempertimbangkannya. Itu tidak akan membiarkan saya menandai Anda berdua dalam satu komentar)
shadowtalker
Kepadatan itu tidak musykil itu. Kebanyakan orang harus mengingat kepadatan dari fisika dan kepadatan populasi dari geografi, atau hanya pengetahuan umum.
Nick Cox
@NickCox Saya pikir itu yang Anda maksudkan dengan merujuk ke mekanika dasar. Dan selain demo kepadatan saya juga tidak melihat bagaimana pengambilan sampel acak diperlukan. Jika ada, saya membayangkan bahwa titik lengket akan membuat siswa non-teknis nyaman dengan gagasan cloud titik. Mungkin membawa ini ke obrolan?
shadowtalker
2

The " mean ", " median " dan " mode " adalah "tendensi sentral", alias "hasil yang paling mungkin" di domain yang berbeda. Mereka semua adalah "taruhan terbaik" di "permainan" yang berbeda.

Probabilitas dan Statistik adalah bidang yang sebagian dibangun oleh penjudi ( tautan , tautan ). Ketika Anda pergi ke pacuan kuda, atau meja poker, Anda ingin tahu beberapa ilmu yang membantu Anda menang. Mereka juga melakukannya, dan menulis tentang hal itu, jadi Anda tidak perlu menciptakannya sendiri.

Dalam pacuan kuda, Anda ingin memilih pemenang. Anda tidak memiliki informasi masa depan, tetapi Anda tahu beberapa informasi masa lalu. Anda tahu seberapa cepat setiap kuda berlari dalam beberapa balapan terakhir. Jika Anda ingin membuat perkiraan seberapa cepat mereka akan berlari di balapan berikutnya, Anda dapat menghitung dan membandingkan rata-rata, alias rata-rata, waktu balapan.

Kecenderungan sentral lainnya adalah "median" - yang merupakan pusat dari daftar yang disortir. Bagaimana jika saya memasukkan kesalahan ketik yang mengerikan pada daftar waktu balapan Anda, dan nilainya 1000x lebih lama dari yang lainnya. Itu akan mengacaukan perkiraan Anda. Anda mungkin tidak bertaruh pada kuda yang menang. Bagaimana Anda mengatasinya? Anda bisa secara manual mencari satu nilai itu, atau Anda mungkin menggunakan "median".

Bagaimana jika Anda bermain kartu, seperti " blackjack ", dan Anda mencoba mencari tahu apakah Anda memerlukan kartu lain mengingat kartu sebelumnya. Kartu yang Anda cari bukan 3,14 karena nomor kartu adalah nilai integer. Bagaimana Anda mengetahui apa taruhan terbaik Anda ketika "rata-rata" atau median tidak bermakna? Dalam hal ini, Anda ingin bertaruh pada "mode" - kartu yang paling mungkin untuk keluar dari tumpukan dealer.

Dalam ketiga kasus tersebut, kecenderungan utama hanyalah cara lain untuk mengatakan "taruhan terbaik".

Jika Anda ingin memperhitungkan bukan hanya kecenderungan sentral dalam taruhan Anda, artinya jika Anda ingin bertaruh sehingga Anda dapat mengurangi dampak kekalahan sambil memaksimalkan kemenangan, maka Anda harus melihat "kecenderungan variasi". Hal-hal seperti standar deviasi, rentang antar-kuantil, atau mode alternatif dan frekuensinya, semuanya digunakan untuk meminimalkan kerugian maksimum sambil memaksimalkan kemungkinan kemenangan.

EngrStudent
sumber
0

Saya pikir ini berguna untuk menjelaskan konsep ini ketika mempertimbangkan berbagai cara, median, dan mode. Nilai-nilai ini tidak ada dengan sendirinya dalam ruang hampa.

Sebagai contoh, inilah cara saya menjelaskan maksudnya.

Katakanlah Anda memiliki 2 peti semangka (peti 1 dan 2). Itu ditutup sehingga Anda tidak bisa melihat semangka di dalam dan dengan demikian Anda tidak tahu ukurannya. Namun, Anda tahu berat total semangka di setiap peti dan masing-masing berisi jumlah semangka yang sama. Dari itu, Anda dapat menghitung bobot rata-rata dari setiap peti semangka (M1 dan M2).

Sekarang Anda memiliki dua nilai rata-rata yang berbeda M1 dan M2, Anda dapat melakukan perbandingan kasar dari masing-masing konten. Jika M1> M2, maka semangka yang dipilih secara acak dari peti 1 mungkin lebih berat dari yang dipetik dari peti 2.

Tentu saja, saya ingin komentar tentang perspektif ini.

Kepedulian Warga
sumber