Haruskah kita mengajarkan kurtosis dalam kursus statistik terapan? Jika ya, bagaimana caranya?

17

Kecenderungan sentral, penyebaran, dan kemiringan dapat didefinisikan dengan relatif baik, setidaknya berdasarkan intuisi; ukuran matematis standar dari hal-hal ini juga berhubungan relatif baik dengan gagasan intuitif kita. Tetapi kurtosis tampaknya berbeda. Ini sangat membingungkan dan tidak cocok dengan intuisi tentang bentuk distribusi.

Penjelasan khas tentang kurtosis dalam pengaturan yang diterapkan adalah kutipan ini dari statistik Terapan untuk bisnis dan manajemen menggunakan Microsoft Excel [ 1 ] :[1]

Kurtosis mengacu pada seberapa tinggi suatu distribusi atau sebaliknya seberapa datar itu. Jika ada lebih banyak nilai data di ekor, daripada apa yang Anda harapkan dari distribusi normal, kurtosisnya positif. Sebaliknya jika nilai ekor kurang, daripada yang Anda harapkan dalam distribusi normal, kurtosisnya negatif. Excel tidak dapat menghitung statistik ini kecuali Anda memiliki setidaknya empat nilai data.

Selain dari kebingungan antara "kurtosis" dan "kelebihan kurtosis" (seperti dalam buku ini, adalah umum untuk menggunakan kata sebelumnya untuk merujuk pada apa yang orang lain sebut sebagai yang terakhir), interpretasi dalam istilah "peakedness" atau "flatness" kemudian kacau oleh pergantian perhatian ke berapa banyak item data di ekor. Mempertimbangkan "puncak" dan "ekor" itu perlu - Kaplansky [ 2 ][2]mengeluh pada tahun 1945 bahwa banyak buku teks pada waktu itu salah menyatakan bahwa kurtosis ada hubungannya dengan seberapa tinggi puncak distribusi dibandingkan dengan distribusi normal, tanpa mempertimbangkan ekor. Tetapi jelas harus mempertimbangkan bentuk baik di puncak dan di ekor membuat intuisi lebih sulit untuk dipahami, suatu titik kutipan yang dikutip di atas melompati dengan memisahkan dari memuncak ke berat ekor seolah-olah konsep-konsep ini sama.

Selain itu, penjelasan "puncak dan ekor" klasik tentang kurtosis ini hanya bekerja dengan baik untuk distribusi simetris dan unimodal (memang, contoh yang diilustrasikan dalam teks tersebut semuanya simetris). Namun cara umum yang "benar" untuk menafsirkan kurtosis, baik dalam hal "puncak", "ekor" atau "bahu", telah diperdebatkan selama beberapa dekade . [ 2 ] [ 3 ] [ 4 ] [ 5 ] [ 6 ][2][3][4][5][6]

Apakah ada cara intuitif untuk mengajarkan kurtosis dalam lingkungan terapan yang tidak akan menyentuh kontradiksi atau contoh tandingan ketika pendekatan yang lebih keras diambil? Apakah kurtosis bahkan merupakan konsep yang berguna sama sekali dalam konteks kursus analisis data terapan seperti ini, berbeda dengan di kelas statistik matematika? Jika "peakedness" dari distribusi adalah sebuah konsep intuitif berguna, kita harus mengajarkannya dengan cara L-momen [ 7 ] bukan?[7]

Herkenhoff, L. dan Fogli, J. (2013). Statistik terapan untuk bisnis dan manajemen menggunakan Microsoft Excel. New York, NY: Springer.[1]

Kaplansky, I. (1945). "Kesalahan umum tentang kurtosis". Jurnal Asosiasi Statistik Amerika,40(230): 259.[2]

Darlington, Richard B (1970). "Apakah Kurtosis Benar-benar 'Memuncak'?" The American Statistician24(2): 19-22[3]

Moor, JJA. (1986) "Arti dari kurtosis: Darlington diperiksa ulang". The American Statistician40(4): 283–284[4]

Balanda, Kevin P. dan MacGillivray, HL (1988). "Kurtosis: Tinjauan Kritis". Ahli Statistik Amerika 42(2): 111–119[5]

DeCarlo, LT (1997). "Tentang makna dan penggunaan kurtosis". Metode psikologis,2(3), 292. Chicago[6]

Hosking, JRM (1992). "Momen atau momen L? Contoh membandingkan dua ukuran bentuk distribusi". The American Statistician46(3): 186–189[7]

Silverfish
sumber
2
Apa yang Anda maksud dengan kurikulum yang biasa? Yaitu tingkat pendidikan apa.
Gumeo
5
Apa sebenarnya yang Anda ajarkan tentang kurtosis? Pertanyaan ini agak kabur. Silakan isi bagaimana hal itu sesuai dengan kurikulum Anda sekarang dan mungkin beberapa contoh intuitif dari langkah-langkah standar yang Anda setujui yang bertentangan dengan kurtosis.
John
3
Saya tidak berpikir ukuran momen kurtosis sebenarnya jauh berbeda dari kemiringan momen dalam hal itu. Dalam kedua kasus mereka tidak benar-benar mencerminkan apa yang orang pikirkan tentang mereka, dan mereka berdua kurang intuitif daripada cerita yang orang katakan tentang diri mereka. Untuk setiap contoh tandingan mengejutkan yang saya miliki tentang kurtosis, saya punya satu lagi tentang kecenderungan. Saya tidak akan menghapus salah satu dari mereka, tetapi saya akan mengurangi penekanan pada ukuran saat ini, saya akan memindahkannya nanti dan mengubah cara mereka diajarkan, sehingga kami tidak mengacaukan konsep yang berbeda dan kami tidak membuat klaim yang tidak berlaku.
Glen_b -Reinstate Monica
3
Kemiringan yang lebih tinggi tidak menyiratkan ekor yang lebih berat ke arah kemiringan. Skewness nol tidak berarti simetri (semua momen ganjil nol bahkan tidak menyiratkan simetri). Simetri bahkan tidak menyiratkan kemiringan nol. Intuisi apa yang tersisa?
Glen_b -Reinstate Monica
3
Inilah jawaban lain dengan beberapa diskusi yang memiliki kelas contoh yang menarik. Ada beberapa yang lain, tetapi saya tidak melihat mereka sekarang. Beberapa postingan whuber juga berguna.
Glen_b -Reinstate Monica

Jawaban:

18

Kurtosis sangat sederhana ... dan bermanfaat. Ini hanyalah ukuran outlier, atau ekor. Ini tidak ada hubungannya dengan puncak apa pun - definisi itu harus ditinggalkan.

Berikut adalah kumpulan data:
0, 3, 4, 1, 2, 3, 0, 2, 1, 3, 2, 0, 2, 2, 3, 2, 5, 2, 3, 999

Perhatikan bahwa '999' adalah pencilan.

Berikut adalah nilai dari kumpulan data:z4

0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 360,98

Perhatikan bahwa hanya outlier yang memberikan yang terasa berbeda dari 0.z4

Rata-rata ini nilai-nilai adalah kurtosis dari distribusi empiris (kurangi 3 jika Anda suka, tidak peduli untuk titik saya membuat): 18,05z4

Seharusnya jelas dari perhitungan ini bahwa data di dekat "puncak" (data non-outlier) berkontribusi hampir tidak ada pada statistik kurtosis.

Kurtosis berguna sebagai ukuran pencilan. Pencilan penting bagi siswa sekolah dasar dan oleh karena itu kurtosis harus diajarkan. Tetapi kurtosis sebenarnya tidak ada hubungannya dengan puncak, apakah itu runcing, datar, bimodal atau tak terbatas. Anda dapat memiliki semua di atas dengan kurtosis kecil dan semua di atas dengan kurtosis besar. Jadi harus PERNAH disajikan sebagai sesuatu yang berkaitan dengan puncak, karena itu akan mengajarkan informasi yang salah. Ini juga membuat materi tidak perlu membingungkan, dan tampaknya kurang bermanfaat.

Ringkasan:

  1. kurtosis bermanfaat sebagai ukuran ekor (outlier).
  2. kurtosis tidak ada hubungannya dengan puncaknya.
  3. kurtosis secara praktis bermanfaat dan harus diajarkan, tetapi hanya sebagai ukuran outlier. Jangan menyebutkan puncak saat mengajar kurtosis.

Artikel ini menjelaskan dengan jelas mengapa definisi "Peakedness" sekarang resmi mati.

Westfall, PH (2014). " Kurtosis as Peakedness, 1905 - 2014. RIP " The American Statistician , 68 (3), 191–195.

Peter Westfall
sumber
4
Selamat datang di CV, saya harap Anda tetap dan berkontribusi lebih banyak di masa depan! Saya telah mengedit posting Anda untuk memasukkan tautan ke makalah dan memformat ulang beberapa notasi matematika, saya harap Anda tidak keberatan. (Dengan menempatkan matematika di $misalnya $z^4$itu mungkin untuk menggunakan )LATEX
Silverfish
6

Meskipun pertanyaannya agak kabur, itu menarik. Di tingkat apa Kurtosis diajarkan? Saya ingat itu disebutkan dalam kursus (tingkat master) dalam model linier (dahulu kala, berdasarkan edisi pertama buku Seber). Itu bukan topik penting, tetapi masuk dalam topik seperti mempelajari (kurangnya) kekokohan uji rasio kemungkinan (uji-F) dari persamaan varian, di mana (dari memori) tingkat yang benar asimptotik tergantung pada memiliki kurtosis yang sama dengan distribusi normal, yang terlalu banyak untuk diasumsikan! Kami melihat sebuah makalah (tapi saya tidak pernah membacanya dengan detail) http://www.jstor.org/stable/4615828?seq=1#page_scan_tab_contents oleh Oja, yang mencoba mencari tahu kemiringan, kurtosis, dan ukuran apa yang benar-benar diukur.

Mengapa saya menemukan ini menarik? Karena saya telah mengajar di Amerika Latin, di mana kelihatannya skewness & kurtosis diajarkan oleh banyak orang sebagai topik penting, dan mencoba untuk memberitahu mahasiswa pascasarjana (banyak dari ekonomi) bahwa kurtosis adalah ukuran buruk dari bentuk distribusi (terutama karena variabilitas pengambilan sampel kekuatan keempat hanya untuk besar), sulit. Saya mencoba membuat mereka menggunakan QQplots sebagai gantinya. Jadi, bagi beberapa komentator, ya, ini diajarkan di suatu tempat, mungkin terlalu banyak!

Ngomong-ngomong, ini bukan hanya pendapat saya. Posting blog berikut https://www.spcforexcel.com/knowledge/basic-statistics/are-skewness-and-kurtosis-useful-statistics berisi kutipan ini (dikaitkan dengan Dr. Wheeler):

Singkatnya, kecenderungan dan kurtosis praktis tidak ada nilainya. Shewhart membuat pengamatan ini di buku pertamanya. Statistik untuk skewness dan kurtosis tidak memberikan informasi yang berguna di luar yang telah diberikan oleh ukuran lokasi dan penyebaran.

Kita harus mengajarkan teknik yang lebih baik untuk mempelajari bentuk distribusi! seperti plot QQ (atau plot distribusi relatif). Dan, jika seseorang masih membutuhkan langkah-langkah numerik, langkah-langkah berdasarkan momen-L lebih baik. Saya akan mengutip satu bagian dari makalah JR Statist Soc B (1990) 52, No 1, pp 105--124 oleh JRM Hosking: "L-saat: Analisis dan Estimasi Distribusi menggunakan Linear Combination of Order Statistics", halaman 109:

λ1λ2μ(F)12σ1(F)τ3τ4 , menurut kriteria Oja, adalah ukuran kemiringan dan kurtosis.

(Untuk saat ini, saya merujuk pada makalah untuk definisi dari langkah-langkah ini, semuanya didasarkan pada momen-L.) Yang menarik adalah bahwa, ukuran tradisional kurtosis, berdasarkan momen keempat, bukan ukuran kurtosis dalam arti Oja! (Saya akan mengedit referensi untuk klaim itu ketika saya bisa menemukannya).

kjetil b halvorsen
sumber
1
Tidak ada masalah dengan penggunaan teknik grafis dan lainnya untuk memahami sifat distribusi, tetapi pernyataan bahwa "kemiringan dan kurtosis secara praktis tidak berharga" adalah hiperbola. Keduanya memiliki efek besar pada semua jenis inferensi statistik.
Peter Westfall
@ Peter Mungkin itu berarti "kurtosis empiris" dalam pernyataan itu.
kjetil b halvorsen
1
Meski begitu, kurtosis empiris memberi tahu Anda ketika Anda memiliki masalah pencilan dalam data Anda. Jadi saya masih berpikir komentar "kecondongan dan kurtosis secara praktis tidak berharga" adalah hiperbola. Tentu, itu mungkin bukan perkiraan yang bagus untuk parameter "populasi", terutama dengan ukuran sampel yang lebih kecil, tetapi "praktis tidak berharga" adalah peregangan. Bahkan jika mereka tidak memperkirakan parameter populasi dengan baik, mereka masih memberikan informasi deskriptif yang berguna tentang kumpulan data yang ada. Informasi yang, tentu saja, harus dilengkapi dengan tampilan grafis seperti plot qq.
Peter Westfall
@ Peter Westfall: Q yang sebenarnya adalah mungkin jika kurtosis empiris adalah ukuran terbaik yang ada untuk mendeteksi masalah yang lebih awal, atau jika ada sesuatu yang lebih baik?
kjetil b halvorsen
Kurtosis empiris mengukur karakter outlier dari kumpulan data, bukan outlier individual. Saya tidak akan mengatakan lebih jauh bahwa kurtosis = 3 (seperti normal) berarti "tidak ada pencilan," tetapi saya akan mengatakan bahwa kasus seperti itu berarti bahwa karakter pencilan (yang diukur dengan nilai rata-rata z, masing-masing dibawa ke keempat daya) mirip dengan distribusi normal. Di sisi lain, kurtosis yang sangat besar tentu saja mengindikasikan adanya masalah pencilan. Ya, plot qq normal lebih baik untuk diagnosis yang lebih halus. BTW, plot qq normal dan kelebihan kurtosis memiliki koneksi matematika yang kuat.
Peter Westfall
3

Menurut saya, koefisien kemiringan berguna untuk memotivasi istilah: kemiringan positif dan kemiringan negatif. Tapi, di situlah berhenti, jika tujuan Anda adalah untuk menilai normalitas. Ukuran klasik skewness dan kurtosis sering gagal untuk menangkap berbagai jenis penyimpangan dari normalitas. Saya biasanya menganjurkan kepada siswa saya untuk menggunakan teknik grafis untuk menilai wajar untuk menilai normalitas, seperti plot qq atau plot probabilitas normal. Juga dengan sampel berukuran cukup, histogram juga dapat digunakan. Boxplots juga berguna untuk mengidentifikasi outlier atau bahkan ekor yang berat.

Ini sejalan dengan rekomendasi yang diajukan gugus tugas APA tahun 1999:

" Asumsi. Anda harus berusaha memastikan bahwa asumsi mendasar yang diperlukan untuk analisis ini masuk akal mengingat data. Periksa residu dengan cermat. Jangan gunakan tes distribusi dan indeks statistik bentuk (misalnya, skewness, kurtosis) sebagai pengganti untuk memeriksa residu Anda secara grafis. Menggunakan uji statistik untuk mendiagnosis masalah dalam pemasangan model memiliki beberapa kekurangan. Pertama, tes signifikansi diagnostik berdasarkan statistik ringkasan (seperti tes untuk homogenitas varians) sering tidak praktis; uji statistik model kami seringkali lebih kuat dari uji statistik asumsi kami. Kedua, statistik seperti skewness dan kurtosis sering gagal mendeteksi penyimpangan distribusi dalam residu. Ketiga, uji statistik tergantung pada ukuran sampel, dan dengan meningkatnya ukuran sampel, tes seringkali akan menolak asumsi yang tidak berbahaya. Secara umum, tidak ada pengganti untuk analisis grafis dari asumsi."

Referensi: Wilkinson, L., & Gugus Tugas tentang Statistik Inferensi. (1999). Metode statistik dalam jurnal psikologi: Pedoman dan penjelasan. Psikolog Amerika, 54, 594-604.

G. Lamothe
sumber
1

Bergantung pada seberapa terapannya kursus, pertanyaan tentang keakuratan estimasi mungkin muncul. Keakuratan estimasi varians sangat bergantung pada kurtosis. Alasan ini terjadi adalah bahwa dengan kurtosis tinggi, distribusi memungkinkan data langka yang berpotensi diamati. Dengan demikian proses menghasilkan data akan menghasilkan nilai-nilai yang sangat ekstrem di beberapa sampel, dan tidak begitu nilai-nilai ekstrem pada yang lain. Dalam kasus sebelumnya, Anda mendapatkan estimasi varians yang sangat besar, dan pada yang terakhir, estimasi varians kecil.

Jika interpretasi "peakedness" yang ketinggalan zaman dan salah dihilangkan, dan fokus diberikan sepenuhnya kepada outlier (yaitu, jarang, dapat diamati ekstrim) sebagai gantinya, maka akan lebih mudah untuk mengajarkan kurtosis dalam kursus pengantar. Tetapi orang-orang mengubah diri mereka menjadi simpul yang berusaha untuk membenarkan "puncaknya" karena itu (secara keliru) dinyatakan demikian dalam buku teks mereka, dan mereka kehilangan aplikasi kurtosis yang sebenarnya. Aplikasi ini sebagian besar berhubungan dengan outlier, dan tentu saja outlier penting dalam kursus statistik terapan.

Peter Westfall
sumber
1
Apakah Anda Peter Westfall yang sama dengan penulis jawaban yang paling banyak dipilih di utas ini? Jika demikian, Anda bisa menggabungkan profil Anda dan kemudian langsung mengedit jawaban lama Anda alih-alih memposting jawaban lain.
Amoeba berkata Reinstate Monica
1
Ya, maaf karena melewatkan netiket.
Peter Westfall
-1

Kurt[X]=E[(Xμσ)4]=μ4σ4=E[(Xμ)4](E[(Xμ)2])2,

1ni=1nμ,σ2,μ4, and show why the fourth moment should be scaled by the square of the variance to make kurtosis the dimensionless measure, i.e. a shape parameter. So, we have now location μ, scale σ2 and any number of parameters to describe the shape such as skew and kurtosis. I'd always start with equations. Supposedly easy to understand explanations in plain English only make everything more confusing. Verbosity clarity.

Aksakal
sumber
1
The problem is that, once you get the kurtosis, it's very unintuitive what (if anything) it means. It doesn't match up with useful qualities of the distribution.
Peter Flom - Reinstate Monica
Yes, kurtosis does match with a very useful quality of a distribution - it is a measure of tailweight (outliers). Supporting mathematical theorems, for which there is no counterexample: (i) kurtosis is between E(Z^4 *I(|Z| >1)) and E(Z^4 *I(|Z| >1)) + 1, for all distributions having finite 4th moment. (ii) for the subclass of continuous distributions where the density of Z^2 is decreasing on (0,1), kurtosis is between E(Z^4 *I(|Z| >1)) and E(Z^4 *I(|Z| >1)) + .5, and (iii) for any sequence of distributions with kurtosis tending to infinity, E(Z^4 *I(|Z| >b))/kurtosis ->1, for every real b.
Peter Westfall