Bagaimana Anda akan menjelaskan konsep mean, median, dan mode daftar angka dan mengapa mereka penting bagi seseorang dengan hanya keterampilan aritmatika dasar? Jangan menyebutkan kemiringan, CLT, kecenderungan sentral, sifat statistiknya, dll.
Saya telah menjelaskan kepada seseorang bahwa maksudnya hanyalah cara cepat dan kotor untuk "meringkas" daftar angka. Tapi melihat ke belakang, ini hampir tidak mencerahkan.
Adakah pemikiran atau contoh dunia nyata?
mean
descriptive-statistics
median
mode
Kepedulian Warga
sumber
sumber
Jawaban:
Terima kasih atas pertanyaan sederhana namun mendalam tentang konsep statistik dasar mean, median, dan mode. Ada beberapa metode / demonstrasi luar biasa yang tersedia untuk menjelaskan dan memahami pemahaman intuitif - daripada aritmatika - konsep ini, tetapi sayangnya mereka tidak dikenal secara luas (atau diajarkan di sekolah, setahu saya).
Berarti:
1. Balance Point: Berarti sebagai titik tumpu
Cara terbaik untuk memahami konsep berarti menganggapnya sebagai titik keseimbangan pada batang seragam. Bayangkan serangkaian titik data, seperti {1,1,1,3,3,6,7,10}. Jika masing-masing titik ditandai pada batang yang seragam dan bobot yang sama ditempatkan pada setiap titik (seperti yang ditunjukkan di bawah) maka titik tumpu harus ditempatkan pada rata-rata data agar batang seimbang.
Demonstrasi visual ini juga mengarah pada interpretasi aritmatika. Alasan aritmatika untuk ini adalah bahwa agar titik tumpu seimbang, total deviasi negatif dari rata-rata (di sisi kiri titik tumpu) harus sama dengan total deviasi positif dari nilai rata-rata (di sisi kanan). Karenanya, mean bertindak sebagai titik penyeimbang dalam suatu distribusi.
Visual ini memungkinkan pemahaman langsung tentang rata-rata karena berkaitan dengan distribusi titik data. Properti lain dari rata-rata yang menjadi jelas dari demonstrasi ini adalah fakta bahwa rata-rata akan selalu berada di antara nilai minimum dan maksimum dalam distribusi. Juga, efek outlier dapat dengan mudah dipahami - bahwa kehadiran outlier akan menggeser titik penyeimbang, dan karenanya, berdampak pada rata-rata.
2. Nilai redistribusi (bagian yang adil)
Cara lain yang menarik untuk memahami nilai tengah adalah dengan menganggapnya sebagai nilai redistribusi . Penafsiran ini memang memerlukan beberapa pemahaman tentang aritmatika di balik perhitungan rata-rata, tetapi ia menggunakan kualitas antropomorfik - yaitu, konsep redistribusi sosialis - untuk secara intuitif memahami konsep rata-rata.
Penghitungan rata-rata melibatkan penjumlahan semua nilai dalam distribusi (set nilai) dan membagi jumlah dengan jumlah titik data dalam distribusi.
Salah satu cara untuk memahami alasan di balik perhitungan ini adalah dengan menganggap setiap titik data sebagai apel (atau item sepadan lainnya). Dengan menggunakan contoh yang sama seperti sebelumnya, kami memiliki delapan orang dalam sampel kami: {1,1,1,3,3,6,7,10}. Orang pertama memiliki satu apel, orang kedua memiliki satu apel, dan seterusnya. Sekarang, jika seseorang ingin mendistribusikan kembali jumlah apel sehingga itu "adil" untuk semua orang, Anda dapat menggunakan rata-rata distribusi untuk melakukan ini. Dengan kata lain, Anda dapat memberikan empat apel (yaitu, nilai rata-rata) kepada semua orang agar distribusinya adil / sama. Demonstrasi ini memberikan penjelasan intuitif untuk rumus di atas: membagi jumlah distribusi dengan jumlah titik data setara dengan mempartisi seluruh distribusi secara merata ke semua titik data.
3. Visual Mnemonics
Mnemonik visual berikut ini menyediakan interpretasi mean dengan cara yang unik:
Ini adalah mnemonik untuk interpretasi nilai leveling dari rata-rata. Tinggi palang A adalah rata-rata ketinggian empat huruf.
Dan ini adalah mnemonik lain untuk interpretasi titik keseimbangan dari rata-rata. Posisi titik tumpu kira-kira rata-rata dari posisi M, E, dan dua kali lipat N.
Median
Setelah interpretasi mean sebagai titik penyeimbang pada tongkat dipahami, median dapat ditunjukkan dengan perpanjangan dari ide yang sama: titik penyeimbang pada kalung .
Ganti batang dengan string, tetapi simpan tanda dan bobot data. Kemudian di ujungnya, pasang tali kedua, lebih panjang dari yang pertama, untuk membentuk lingkaran [seperti kalung], dan menggantungkan loop di atas katrol yang dilumasi dengan baik.
Anggaplah, awalnya, bahwa bobotnya berbeda. Katrol dan keseimbangan loop ketika jumlah bobot yang sama adalah untuk setiap sisi. Dengan kata lain, loop 'menyeimbangkan' ketika median adalah titik terendah.
Perhatikan bahwa jika salah satu dari bobot tersebut meluncur ke atas loop menciptakan pencilan, loop tidak bergerak. Ini menunjukkan, secara fisik, prinsip bahwa median tidak terpengaruh oleh outlier.
Mode
Mode ini mungkin konsep yang paling mudah untuk dipahami karena melibatkan operasi matematika paling dasar: berhitung. Fakta bahwa itu sama dengan data titik lead yang paling sering terjadi untuk akronim: “ M ost-sering O ccurring D ata E lement”.
Mode ini juga dapat dianggap sebagai nilai paling umum dalam satu set. (Meskipun, pemahaman yang lebih dalam tentang 'tipikal' akan mengarah pada perwakilan, atau nilai rata-rata. Namun, pantas untuk menyamakan 'tipikal' dengan mode berdasarkan arti yang sangat harfiah dari kata 'tipikal'.)
Sumber:
sumber
Saya harus bertanya-tanya apakah kriteria Anda dapat dicapai karena Anda tampaknya ingin efektivitas maksimal dan kekuatan penjelas dengan bahan minimal. Tetapi contoh sederhana seperti
1 1 2 2 2 3 3 4 5 6 15
memungkinkan perhitungan langsung dari mode (2), median (3) dan rata-rata (44/11) = 4 dan dengan demikian menunjukkan bahwa mereka dapat berbeda.
Anda kemudian dapat menjelaskan bahwa ide - ide dari nilai yang paling umum, nilai di tengah dan rata-rata berbeda. Dan memperkenalkan komplikasi oleh
mengubah nilai untuk menunjukkan mode bisa ambigu
menggunakan contoh dengan jumlah nilai genap untuk menjelaskan konvensi untuk menghitung median
berbagai nilai pada bagian ekor untuk menekankan apa yang terjadi pada nilai rata-rata, dan mengapa dan mengapa tidak hal itu mungkin diinginkan.
menggunakan contoh-contoh sederhana di mana dua atau tiga mode rata-rata, rata-rata bertepatan.
Saya belum menyebutkan kecenderungan utama dalam pengajaran saya kecuali untuk mengatakan bahwa itu adalah istilah dalam berbagai literatur. Saya lebih suka berbicara tentang level dan bagaimana mengukurnya. Sebaliknya, saya tidak berpikir analisis data serius apa pun mungkin dilakukan kecuali orang memiliki perasaan minimal terhadap kemiringan seperti lebih biasa daripada simetri.
sumber
Beginilah cara saya menjelaskannya:
Mean (aritmatika) adalah titik yang mengambil seluruh data yang ditetapkan, dan menetap di suatu tempat "di tengah." Mintalah mereka memikirkan awan titik, atau gumpalan, di ruang angkasa: mean adalah pusat massa dari awan titik itu.
The median adalah titik yang memiliki "jumlah poin yang sama di semua sisi" (di mana jelas konsep "sisi" tidak didefinisikan dengan baik di 2+ dimensi). Ini mewakili jenis "tengah" yang lain, dan sebenarnya jenis yang lebih intuitif dalam beberapa hal. Memikirkan gumpalan yang sama di ruang angkasa, jelas bahwa jika gumpalan itu miring, maka rata-rata akan bergeser. Tetapi ketidakseimbangan ini dapat dicapai dengan salah satu dari dua cara: Anda menambahkan lebih banyak poin di satu area, atau meningkatkan dispersi poin di area tersebut. Jika Anda meningkatkan dispersi poin dalam satu area tanpa meningkatkan jumlah poin, maka median masih memiliki jumlah poin yang sama "di semua sisi" dan tidak akan bergeser sepadan dengan rata-rata.
Anda dapat menunjukkan ini dengan dua "gumpalan" yang sangat sepele: dan . , sedangkan . Tapi saya sarankan mulai dengan penjelasan geometris / visual "berbasis gumpalan" pertama: dalam pengalaman saya lebih mudah untuk memulai dengan demonstrasi grafis tangan-melambaikan, kemudian pindah ke contoh mainan beton. Saya menemukan bahwa kebanyakan orang (termasuk saya sendiri) tidak berorientasi pada angka, dan memulai dengan penjelasan numerik adalah resep untuk kebingungan. Anda selalu dapat kembali dan mengajarkan definisi yang lebih tepat nanti.y ′ = ( 1 , 2 , 3 , 4 , 99 ) rata-rata ( y ) = median ( y ) rata-rata ( y ′ ) > median ( y ′ )y=(1,2,3,4,5) y′=(1,2,3,4,99) mean(y)=median(y) mean(y′)>median(y′)
The Modus adalah titik itu, jika poin secara acak sampel dari gumpalan itu, adalah paling mungkin muncul (mengakui bahwa ini adalah fudge untuk data kontinu). Ini bisa, tetapi tidak harus, terletak di dekat mean atau median.
Setelah Anda menjelaskan konsep-konsep ini, maka Anda dapat beralih ke demo yang lebih "tampak statistik":
Garis solid adalah rerata. Garis putus-putus adalah median. Garis putus-putus adalah mode. Rerata mewakili posisi titik data sepanjang sumbu x, sedangkan median hanya mencerminkan jumlah titik data di kedua sisi. Mode hanyalah titik probabilitas terbesar, yang berbeda dari rata-rata dan median.
Kode R:
sumber
The " mean ", " median " dan " mode " adalah "tendensi sentral", alias "hasil yang paling mungkin" di domain yang berbeda. Mereka semua adalah "taruhan terbaik" di "permainan" yang berbeda.
Probabilitas dan Statistik adalah bidang yang sebagian dibangun oleh penjudi ( tautan , tautan ). Ketika Anda pergi ke pacuan kuda, atau meja poker, Anda ingin tahu beberapa ilmu yang membantu Anda menang. Mereka juga melakukannya, dan menulis tentang hal itu, jadi Anda tidak perlu menciptakannya sendiri.
Dalam pacuan kuda, Anda ingin memilih pemenang. Anda tidak memiliki informasi masa depan, tetapi Anda tahu beberapa informasi masa lalu. Anda tahu seberapa cepat setiap kuda berlari dalam beberapa balapan terakhir. Jika Anda ingin membuat perkiraan seberapa cepat mereka akan berlari di balapan berikutnya, Anda dapat menghitung dan membandingkan rata-rata, alias rata-rata, waktu balapan.
Kecenderungan sentral lainnya adalah "median" - yang merupakan pusat dari daftar yang disortir. Bagaimana jika saya memasukkan kesalahan ketik yang mengerikan pada daftar waktu balapan Anda, dan nilainya 1000x lebih lama dari yang lainnya. Itu akan mengacaukan perkiraan Anda. Anda mungkin tidak bertaruh pada kuda yang menang. Bagaimana Anda mengatasinya? Anda bisa secara manual mencari satu nilai itu, atau Anda mungkin menggunakan "median".
Bagaimana jika Anda bermain kartu, seperti " blackjack ", dan Anda mencoba mencari tahu apakah Anda memerlukan kartu lain mengingat kartu sebelumnya. Kartu yang Anda cari bukan 3,14 karena nomor kartu adalah nilai integer. Bagaimana Anda mengetahui apa taruhan terbaik Anda ketika "rata-rata" atau median tidak bermakna? Dalam hal ini, Anda ingin bertaruh pada "mode" - kartu yang paling mungkin untuk keluar dari tumpukan dealer.
Dalam ketiga kasus tersebut, kecenderungan utama hanyalah cara lain untuk mengatakan "taruhan terbaik".
Jika Anda ingin memperhitungkan bukan hanya kecenderungan sentral dalam taruhan Anda, artinya jika Anda ingin bertaruh sehingga Anda dapat mengurangi dampak kekalahan sambil memaksimalkan kemenangan, maka Anda harus melihat "kecenderungan variasi". Hal-hal seperti standar deviasi, rentang antar-kuantil, atau mode alternatif dan frekuensinya, semuanya digunakan untuk meminimalkan kerugian maksimum sambil memaksimalkan kemungkinan kemenangan.
sumber
Saya pikir ini berguna untuk menjelaskan konsep ini ketika mempertimbangkan berbagai cara, median, dan mode. Nilai-nilai ini tidak ada dengan sendirinya dalam ruang hampa.
Sebagai contoh, inilah cara saya menjelaskan maksudnya.
Katakanlah Anda memiliki 2 peti semangka (peti 1 dan 2). Itu ditutup sehingga Anda tidak bisa melihat semangka di dalam dan dengan demikian Anda tidak tahu ukurannya. Namun, Anda tahu berat total semangka di setiap peti dan masing-masing berisi jumlah semangka yang sama. Dari itu, Anda dapat menghitung bobot rata-rata dari setiap peti semangka (M1 dan M2).
Sekarang Anda memiliki dua nilai rata-rata yang berbeda M1 dan M2, Anda dapat melakukan perbandingan kasar dari masing-masing konten. Jika M1> M2, maka semangka yang dipilih secara acak dari peti 1 mungkin lebih berat dari yang dipetik dari peti 2.
Tentu saja, saya ingin komentar tentang perspektif ini.
sumber