Baru-baru ini saya menyadari bahwa ada perbedaan dalam nilai kurtosis yang diberikan oleh SPSS dan Stata.
Lihat http://www.ats.ucla.edu/stat/mult_pkg/faq/general/kurtosis.htm
Pemahaman saya adalah bahwa interpretasi yang sama karenanya akan berbeda.
Adakah saran tentang cara menangani hal ini?
spss
stata
interpretation
kurtosis
Cesare Camestre
sumber
sumber
Jawaban:
Tiga formula
Tiga formula untuk kurtosis umumnya digunakan oleh program yang berbeda. Saya akan menyatakan ketiga formula ( , G 2 dan b 2 ) dan program yang menggunakannya.g2 G2 b2
The Rumus pertama dan definisi khas digunakan dalam banyak buku teks adalah (ini adalah rumus kedua di link yang Anda berikan) manamrmenunjukkanmomen sampel:
Terkadang, istilah koreksi -3 ditambahkan ke rumus ini sehingga distribusi normal memiliki kurtosis 0. Formula kurtosis dengan jangka waktu -3 disebut kelebihan kurtosis (rumus pertama dalam tautan yang Anda berikan).
The Rumus kedua adalah (digunakan oleh SAS, SPSS dan MS Excel, ini adalah rumus ketiga dalam link yang Anda berikan)
R
kurtosis
e1071
type
Kedua makalah ini membahas dan membandingkan ketiga formula: pertama , kedua .
Ringkasan perbedaan antara formula
Lihat juga halaman Wikipedia dan halaman MathWorld tentang kurtosis.
sumber
Tautan yang dimaksud berbicara tentang SAS juga. Tetapi sebenarnya tidak ada dalam pertanyaan ini, kecuali kemungkinan fokus poster itu sendiri, membatasi itu untuk program-program tertentu yang disebutkan.
Saya pikir kita perlu memisahkan berbagai jenis masalah di sini, beberapa di antaranya adalah ilusi dan beberapa di antaranya asli.
Beberapa program melakukan, dan beberapa tidak, mengurangi 3 sehingga ukuran kurtosis yang dilaporkan adalah 3 untuk variabel Gaussian / normal tanpa pengurangan dan 0 dengan pengurangan. Saya telah melihat orang-orang bingung dengan itu, sering kali ketika perbedaannya ternyata adalah 2.999 dan tidak tepat 3.
Jadi, ada masalah kecil formula, # 1 menjadi kesepakatan yang jauh lebih besar dari # 2, tetapi keduanya minor jika dipahami. Sarannya jelas adalah melihat dokumentasi untuk program yang Anda gunakan, dan jika tidak ada dokumentasi yang menjelaskan perincian semacam itu untuk segera meninggalkan program itu. Tetapi kasus uji sesederhana variabel (1, 2) menghasilkan kurtosis 1 atau 4 tergantung pada # 1 saja (tanpa faktor koreksi).
Pertanyaannya kemudian bertanya tentang penafsiran, tetapi ini adalah masalah yang jauh lebih terbuka dan kontroversial.
Sebelum kita sampai ke area utama diskusi, kesulitan yang sering dilaporkan tetapi sedikit diketahui adalah bahwa estimasi kurtosis dibatasi sebagai fungsi dari ukuran sampel. Saya menulis ulasan di Cox, NJ 2010. Batas-batas skewness sampel dan kurtosis. Stata Journal 10 (3): 482-495. http://www.stata-journal.com/article.html?article=st0204
Abstrak: Kecenderungan sampel dan kurtosis dibatasi oleh fungsi ukuran sampel. Batas-batas, atau perkiraan mereka, telah berulang kali ditemukan kembali selama beberapa dekade terakhir, namun demikian tampaknya tetap hanya kurang dikenal. Batasan memberikan bias pada estimasi dan, dalam kasus ekstrim, menyiratkan bahwa tidak ada sampel yang dapat memberikan kesaksian yang tepat untuk distribusi induknya. Hasil utama dijelaskan dalam ulasan tutorial, dan ditunjukkan bagaimana Stata dan Mata dapat digunakan untuk mengkonfirmasi dan mengeksplorasi konsekuensinya.
Sekarang untuk apa yang biasanya dianggap sebagai inti dari masalah ini:
Banyak orang menerjemahkan kurtosis sebagai puncaknya, tetapi yang lain menekankan bahwa kurtosis sering berfungsi sebagai ukuran berat ekor. Faktanya, kedua interpretasi itu bisa menjadi kata-kata yang masuk akal untuk beberapa distribusi. Hampir tidak terhindarkan bahwa tidak ada interpretasi verbal sederhana tentang kurtosis: bahasa kita tidak cukup kaya pada perbandingan jumlah kekuatan penyimpangan keempat dari mean dan jumlah kekuatan kedua yang sama.
Dalam klasik kecil dan sering diabaikan, Irving Kaplansky (1945a) menarik perhatian pada empat contoh distribusi dengan nilai-nilai berbeda dari kurtosis dan perilaku yang tidak konsisten dengan beberapa diskusi tentang kurtosis.
Sangat membantu untuk merencanakan kepadatan ini. Pengguna stata dapat mengunduh
kaplansky
program saya dari SSC. Menggunakan skala logaritmik untuk kepadatan dapat membantu.Tanpa memberikan rincian lengkap, contoh-contoh ini merongrong setiap cerita sederhana yang kurtosis rendah atau tinggi memiliki interpretasi yang jelas dalam hal puncaknya atau memang ada satu kontras lainnya.
Jika nama Irving Kaplansky berbunyi, mungkin karena Anda tahu karyanya dalam aljabar modern. Dia (1917-2006) adalah ahli matematika Kanada (kemudian Amerika) dan mengajar dan meneliti di Harvard, Chicago dan Berkeley, dengan tahun perang di Grup Matematika Terapan Dewan Pertahanan Nasional di Universitas Columbia. Kaplansky memberikan kontribusi besar pada teori grup, teori cincin, teori aljabar operator, dan teori lapangan. Dia adalah seorang pianis dan penulis lirik ulung dan seorang ekspositor matematika yang antusias dan jernih. Perhatikan juga beberapa kontribusi lain untuk probabilitas dan statistik oleh Kaplansky (1943, 1945b) dan Kaplansky dan Riordan (1945).
Kaplansky, I. 1943. Karakterisasi distribusi normal. Sejarah Statistik Matematika 14: 197-198.
Kaplansky, I. 1945a. Kesalahan umum tentang kurtosis. Jurnal, Asosiasi Statistik Amerika 40: 259 saja.
Kaplansky, I. 1945b. Distribusi asimptotik dari run elemen berurutan. Sejarah Statistik Matematika 16: 200-203.
Kaplansky, I. dan Riordan, J. 1945. Pencocokan ganda dan dijalankan dengan metode simbolik. Sejarah Statistik Matematika 16: 272-277.
sumber