Kecenderungan sentral, penyebaran, dan kemiringan dapat didefinisikan dengan relatif baik, setidaknya berdasarkan intuisi; ukuran matematis standar dari hal-hal ini juga berhubungan relatif baik dengan gagasan intuitif kita. Tetapi kurtosis tampaknya berbeda. Ini sangat membingungkan dan tidak cocok dengan intuisi tentang bentuk distribusi.
Penjelasan khas tentang kurtosis dalam pengaturan yang diterapkan adalah kutipan ini dari statistik Terapan untuk bisnis dan manajemen menggunakan Microsoft Excel [ 1 ] :
Kurtosis mengacu pada seberapa tinggi suatu distribusi atau sebaliknya seberapa datar itu. Jika ada lebih banyak nilai data di ekor, daripada apa yang Anda harapkan dari distribusi normal, kurtosisnya positif. Sebaliknya jika nilai ekor kurang, daripada yang Anda harapkan dalam distribusi normal, kurtosisnya negatif. Excel tidak dapat menghitung statistik ini kecuali Anda memiliki setidaknya empat nilai data.
Selain dari kebingungan antara "kurtosis" dan "kelebihan kurtosis" (seperti dalam buku ini, adalah umum untuk menggunakan kata sebelumnya untuk merujuk pada apa yang orang lain sebut sebagai yang terakhir), interpretasi dalam istilah "peakedness" atau "flatness" kemudian kacau oleh pergantian perhatian ke berapa banyak item data di ekor. Mempertimbangkan "puncak" dan "ekor" itu perlu - Kaplansky [ 2 ]mengeluh pada tahun 1945 bahwa banyak buku teks pada waktu itu salah menyatakan bahwa kurtosis ada hubungannya dengan seberapa tinggi puncak distribusi dibandingkan dengan distribusi normal, tanpa mempertimbangkan ekor. Tetapi jelas harus mempertimbangkan bentuk baik di puncak dan di ekor membuat intuisi lebih sulit untuk dipahami, suatu titik kutipan yang dikutip di atas melompati dengan memisahkan dari memuncak ke berat ekor seolah-olah konsep-konsep ini sama.
Selain itu, penjelasan "puncak dan ekor" klasik tentang kurtosis ini hanya bekerja dengan baik untuk distribusi simetris dan unimodal (memang, contoh yang diilustrasikan dalam teks tersebut semuanya simetris). Namun cara umum yang "benar" untuk menafsirkan kurtosis, baik dalam hal "puncak", "ekor" atau "bahu", telah diperdebatkan selama beberapa dekade . [ 2 ] [ 3 ] [ 4 ] [ 5 ] [ 6 ]
Apakah ada cara intuitif untuk mengajarkan kurtosis dalam lingkungan terapan yang tidak akan menyentuh kontradiksi atau contoh tandingan ketika pendekatan yang lebih keras diambil? Apakah kurtosis bahkan merupakan konsep yang berguna sama sekali dalam konteks kursus analisis data terapan seperti ini, berbeda dengan di kelas statistik matematika? Jika "peakedness" dari distribusi adalah sebuah konsep intuitif berguna, kita harus mengajarkannya dengan cara L-momen [ 7 ] bukan?
Herkenhoff, L. dan Fogli, J. (2013). Statistik terapan untuk bisnis dan manajemen menggunakan Microsoft Excel. New York, NY: Springer.
Kaplansky, I. (1945). "Kesalahan umum tentang kurtosis". Jurnal Asosiasi Statistik Amerika,40(230): 259.
Darlington, Richard B (1970). "Apakah Kurtosis Benar-benar 'Memuncak'?" The American Statistician24(2): 19-22
Moor, JJA. (1986) "Arti dari kurtosis: Darlington diperiksa ulang". The American Statistician40(4): 283–284
Balanda, Kevin P. dan MacGillivray, HL (1988). "Kurtosis: Tinjauan Kritis". Ahli Statistik Amerika 42(2): 111–119
DeCarlo, LT (1997). "Tentang makna dan penggunaan kurtosis". Metode psikologis,2(3), 292. Chicago
Hosking, JRM (1992). "Momen atau momen L? Contoh membandingkan dua ukuran bentuk distribusi". The American Statistician46(3): 186–189
sumber
Jawaban:
Kurtosis sangat sederhana ... dan bermanfaat. Ini hanyalah ukuran outlier, atau ekor. Ini tidak ada hubungannya dengan puncak apa pun - definisi itu harus ditinggalkan.
Berikut adalah kumpulan data:
0, 3, 4, 1, 2, 3, 0, 2, 1, 3, 2, 0, 2, 2, 3, 2, 5, 2, 3, 999
Perhatikan bahwa '999' adalah pencilan.
Berikut adalah nilai dari kumpulan data:z4
0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 360,98
Perhatikan bahwa hanya outlier yang memberikan yang terasa berbeda dari 0.z4
Rata-rata ini nilai-nilai adalah kurtosis dari distribusi empiris (kurangi 3 jika Anda suka, tidak peduli untuk titik saya membuat): 18,05z4
Seharusnya jelas dari perhitungan ini bahwa data di dekat "puncak" (data non-outlier) berkontribusi hampir tidak ada pada statistik kurtosis.
Kurtosis berguna sebagai ukuran pencilan. Pencilan penting bagi siswa sekolah dasar dan oleh karena itu kurtosis harus diajarkan. Tetapi kurtosis sebenarnya tidak ada hubungannya dengan puncak, apakah itu runcing, datar, bimodal atau tak terbatas. Anda dapat memiliki semua di atas dengan kurtosis kecil dan semua di atas dengan kurtosis besar. Jadi harus PERNAH disajikan sebagai sesuatu yang berkaitan dengan puncak, karena itu akan mengajarkan informasi yang salah. Ini juga membuat materi tidak perlu membingungkan, dan tampaknya kurang bermanfaat.
Ringkasan:
Artikel ini menjelaskan dengan jelas mengapa definisi "Peakedness" sekarang resmi mati.
Westfall, PH (2014). " Kurtosis as Peakedness, 1905 - 2014. RIP " The American Statistician , 68 (3), 191–195.
sumber
$
misalnya$z^4$
itu mungkin untuk menggunakan )Meskipun pertanyaannya agak kabur, itu menarik. Di tingkat apa Kurtosis diajarkan? Saya ingat itu disebutkan dalam kursus (tingkat master) dalam model linier (dahulu kala, berdasarkan edisi pertama buku Seber). Itu bukan topik penting, tetapi masuk dalam topik seperti mempelajari (kurangnya) kekokohan uji rasio kemungkinan (uji-F) dari persamaan varian, di mana (dari memori) tingkat yang benar asimptotik tergantung pada memiliki kurtosis yang sama dengan distribusi normal, yang terlalu banyak untuk diasumsikan! Kami melihat sebuah makalah (tapi saya tidak pernah membacanya dengan detail) http://www.jstor.org/stable/4615828?seq=1#page_scan_tab_contents oleh Oja, yang mencoba mencari tahu kemiringan, kurtosis, dan ukuran apa yang benar-benar diukur.
Mengapa saya menemukan ini menarik? Karena saya telah mengajar di Amerika Latin, di mana kelihatannya skewness & kurtosis diajarkan oleh banyak orang sebagai topik penting, dan mencoba untuk memberitahu mahasiswa pascasarjana (banyak dari ekonomi) bahwa kurtosis adalah ukuran buruk dari bentuk distribusi (terutama karena variabilitas pengambilan sampel kekuatan keempat hanya untuk besar), sulit. Saya mencoba membuat mereka menggunakan QQplots sebagai gantinya. Jadi, bagi beberapa komentator, ya, ini diajarkan di suatu tempat, mungkin terlalu banyak!
Ngomong-ngomong, ini bukan hanya pendapat saya. Posting blog berikut https://www.spcforexcel.com/knowledge/basic-statistics/are-skewness-and-kurtosis-useful-statistics berisi kutipan ini (dikaitkan dengan Dr. Wheeler):
Kita harus mengajarkan teknik yang lebih baik untuk mempelajari bentuk distribusi! seperti plot QQ (atau plot distribusi relatif). Dan, jika seseorang masih membutuhkan langkah-langkah numerik, langkah-langkah berdasarkan momen-L lebih baik. Saya akan mengutip satu bagian dari makalah JR Statist Soc B (1990) 52, No 1, pp 105--124 oleh JRM Hosking: "L-saat: Analisis dan Estimasi Distribusi menggunakan Linear Combination of Order Statistics", halaman 109:
(Untuk saat ini, saya merujuk pada makalah untuk definisi dari langkah-langkah ini, semuanya didasarkan pada momen-L.) Yang menarik adalah bahwa, ukuran tradisional kurtosis, berdasarkan momen keempat, bukan ukuran kurtosis dalam arti Oja! (Saya akan mengedit referensi untuk klaim itu ketika saya bisa menemukannya).
sumber
Menurut saya, koefisien kemiringan berguna untuk memotivasi istilah: kemiringan positif dan kemiringan negatif. Tapi, di situlah berhenti, jika tujuan Anda adalah untuk menilai normalitas. Ukuran klasik skewness dan kurtosis sering gagal untuk menangkap berbagai jenis penyimpangan dari normalitas. Saya biasanya menganjurkan kepada siswa saya untuk menggunakan teknik grafis untuk menilai wajar untuk menilai normalitas, seperti plot qq atau plot probabilitas normal. Juga dengan sampel berukuran cukup, histogram juga dapat digunakan. Boxplots juga berguna untuk mengidentifikasi outlier atau bahkan ekor yang berat.
Ini sejalan dengan rekomendasi yang diajukan gugus tugas APA tahun 1999:
" Asumsi. Anda harus berusaha memastikan bahwa asumsi mendasar yang diperlukan untuk analisis ini masuk akal mengingat data. Periksa residu dengan cermat. Jangan gunakan tes distribusi dan indeks statistik bentuk (misalnya, skewness, kurtosis) sebagai pengganti untuk memeriksa residu Anda secara grafis. Menggunakan uji statistik untuk mendiagnosis masalah dalam pemasangan model memiliki beberapa kekurangan. Pertama, tes signifikansi diagnostik berdasarkan statistik ringkasan (seperti tes untuk homogenitas varians) sering tidak praktis; uji statistik model kami seringkali lebih kuat dari uji statistik asumsi kami. Kedua, statistik seperti skewness dan kurtosis sering gagal mendeteksi penyimpangan distribusi dalam residu. Ketiga, uji statistik tergantung pada ukuran sampel, dan dengan meningkatnya ukuran sampel, tes seringkali akan menolak asumsi yang tidak berbahaya. Secara umum, tidak ada pengganti untuk analisis grafis dari asumsi."
Referensi: Wilkinson, L., & Gugus Tugas tentang Statistik Inferensi. (1999). Metode statistik dalam jurnal psikologi: Pedoman dan penjelasan. Psikolog Amerika, 54, 594-604.
sumber
Bergantung pada seberapa terapannya kursus, pertanyaan tentang keakuratan estimasi mungkin muncul. Keakuratan estimasi varians sangat bergantung pada kurtosis. Alasan ini terjadi adalah bahwa dengan kurtosis tinggi, distribusi memungkinkan data langka yang berpotensi diamati. Dengan demikian proses menghasilkan data akan menghasilkan nilai-nilai yang sangat ekstrem di beberapa sampel, dan tidak begitu nilai-nilai ekstrem pada yang lain. Dalam kasus sebelumnya, Anda mendapatkan estimasi varians yang sangat besar, dan pada yang terakhir, estimasi varians kecil.
Jika interpretasi "peakedness" yang ketinggalan zaman dan salah dihilangkan, dan fokus diberikan sepenuhnya kepada outlier (yaitu, jarang, dapat diamati ekstrim) sebagai gantinya, maka akan lebih mudah untuk mengajarkan kurtosis dalam kursus pengantar. Tetapi orang-orang mengubah diri mereka menjadi simpul yang berusaha untuk membenarkan "puncaknya" karena itu (secara keliru) dinyatakan demikian dalam buku teks mereka, dan mereka kehilangan aplikasi kurtosis yang sebenarnya. Aplikasi ini sebagian besar berhubungan dengan outlier, dan tentu saja outlier penting dalam kursus statistik terapan.
sumber
sumber