Bagaimana kurtosis distribusi terkait dengan geometri fungsi kepadatan?

12

Kurtosis adalah untuk mengukur puncak dan kerataan suatu distribusi. Fungsi kepadatan distribusi, jika ada, dapat dilihat sebagai kurva, dan memiliki fitur geometris (seperti kelengkungan, konveksitas, ...) terkait dengan bentuknya.

Jadi saya bertanya-tanya apakah kurtosis suatu distribusi berhubungan dengan beberapa fitur geometris dari fungsi kerapatan, yang dapat menjelaskan makna geometris kurtosis?

Tim
sumber
Saya meminta beberapa hubungan dalam rumus dengan sejumlah geometris dari kurva kepadatan, bukan hanya makna samar yang saya tunjukkan di posting saya. Atau tidak mengapa untuk memiliki beberapa penjelasan tentang mengapa kurtosis memiliki makna geometris
Tim
@ Peter Itu jauh dari kebenaran. Seseorang dapat memodifikasi geometri grafik PDF hampir secara sewenang-wenang tanpa mengubah momen tertentu (jumlah terbatasnya).
whuber
Pertanyaan yang berkaitan erat di stats.stackexchange.com/questions/25010/… menunjukkan apa jawaban yang tepat untuk pertanyaan ini.
whuber
@whuber sementara saya setuju dan berterima kasih atas contoh itu, saya juga bertanya-tanya apakah itu tidak mengatakan lebih banyak tentang properti luar biasa dari keluarga pdf tertentu daripada tentang kurtosis secara umum.
user603
@ user603 Itu hal yang baik untuk bertanya-tanya. Namun, pernyataan ini bukan tentang keluarga khusus ini: kebetulan bahwa untuk distribusi lognormal seseorang dapat menghasilkan representasi eksplisit dari kelas PDF alternatif dengan momen yang sama. Ini adalah khusus yang semua momen yang sama, tetapi perturbing kebanyakan distribusi dengan cara yang perbaikan jumlah terbatas saat-saat mereka tidak sulit. (Sulit untuk distribusi diskrit tertentu, seperti Bernoulli, tetapi mereka tidak memiliki PDF.)
whuber

Jawaban:

17

Saat-saat distribusi terus menerus, dan fungsi-fungsi mereka seperti kurtosis, memberi tahu Anda sangat sedikit tentang grafik fungsi kepadatannya.

Pertimbangkan, misalnya, grafik berikut ini.

masukkan deskripsi gambar di sini

Masing-masing adalah grafik dari fungsi non-negatif yang dipadukan dengan : semuanya adalah PDF. Selain itu, mereka semua memiliki momen yang persis sama - setiap jumlah tak terbatas terakhir dari mereka. Dengan demikian mereka berbagi kurtosis yang umum (yang terjadi sama dengan - 3 + 3 e 2 + 2 e 3 + e 4 ).13+3e2+2e3+e4

Rumus untuk fungsi-fungsi ini adalah

fk,s(x)=12πxexp(12(log(x))2)(1+ssin(2kπlog(x))

untuk - 1 s 1 , dan k Z .x>0, 1s1,kZ.

Angka tersebut menampilkan nilai di sebelah kiri dan nilai k di atas. Kolom sebelah kiri menunjukkan PDF untuk distribusi lognormal standar.sk

Latihan 6.21 dalam Teori Statistik Lanjutan Kendall (Stuart & Ord, edisi ke-5) meminta pembaca untuk menunjukkan bahwa semua ini memiliki momen yang sama.

Kita dapat memodifikasi pdf apa pun untuk membuat pdf lain dengan bentuk yang sangat berbeda tetapi dengan momen pusat kedua dan keempat yang sama (katakanlah), yang karenanya memiliki kurtosis yang sama. Dari contoh ini saja harus jelas bahwa kurtosis bukanlah ukuran simetri, unimodality, bimodality, bimodality, convexity, atau karakterisasi geometri kurva lainnya yang akrab.

Fungsi momen, oleh karena itu (dan kurtosis sebagai kasus khusus) tidak menggambarkan sifat geometris dari grafik pdf. Ini secara intuitif masuk akal: karena pdf mewakili probabilitas melalui area, kita hampir dapat dengan bebas menggeser kepadatan probabilitas di sekitar dari satu lokasi ke lokasi lain, secara radikal mengubah tampilan pdf, sambil memperbaiki jumlah saat tertentu yang ditentukan sebelumnya.

whuber
sumber
1
"Dari contoh ini saja itu harus sangat jelas ... setiap karakterisasi geometris akrab dari kurva." Saya mengerti maksud Anda, tetapi ada dasar untuk perbedaan yang wajar dalam penafsiran di sini. Penafsiran lain adalah bahwa Darlington, yang menunjukkan bagaimana mulai dari distribusi simetris, memindahkan beberapa massa pada titik tertentu meningkatkan / mengurangi kurtosis (sekali lagi, bukan kontradiksi contoh Anda, hanya pemahaman yang lebih 'positif').
user603
1
@ user603 Saya tidak setuju, tapi saya pikir pendekatan "positif" mengabaikan asumsi yang sangat khusus yang secara implisit dibuat agar bisa bekerja sama sekali. Kita juga bisa mulai dengan grafik PDF yang sangat asimetris dengan kemiringan nol (tidak sulit untuk dibuat). Dengan demikian pendekatan positif itu hanya menggambarkan apa yang terjadi pada PDF tertentu yang sangat istimewa ketika massa dipindahkan. Meskipun itu bisa sangat berguna untuk intuisi, tampaknya tidak ada kaitan logis dengan pertanyaan ini.
whuber
1
Saya menyetujui kemiringan (dan untuk jawaban Anda secara umum). Tetapi kurtosis, sebagai fungsi, memiliki minimum. Itu membuat segalanya sedikit lebih menarik.
user603
1
@ user603 Terima kasih; itu perbedaan wawasan. Saya tidak berpikir itu mengubah salah satu kesimpulan saat ini dalam cara-cara penting tetapi tentu saja membantu intuisi dan menunjuk pada perbedaan penting antara momen genap dan momen ganjil.
whuber
6

Untuk distribusi simetris (yaitu saat momen yang terpusat bermakna) kurtosis mengukur fitur geometris pdf yang mendasarinya. Tidak benar bahwa kurtosis mengukur (atau secara umum terkait) dengan puncak distribusi. Sebaliknya, kurtosis mengukur seberapa jauh distribusi yang mendasarinya tidak simetris dan bimodal (secara aljabar, distribusi simetris dan bimodal yang sempurna akan memiliki kurtosis 1, yang merupakan nilai terkecil yang mungkin dimiliki oleh kurtosis) [0].

Singkatnya [1], jika Anda mendefinisikan:

k=E(xμ)4/σ4

dengan , laluE(X)=μ,V(X)=σ2

k=V(Z2)+11

untuk .Z=(Xμ)/σ

Ini menyiratkan bahwa dapat dilihat sebagai ukuran dispersi Z 2 di sekitar ekspektasinya 1. Dengan kata lain, jika Anda memiliki interpretasi geometri varian dan ekspektasi, maka kurtosis akan mengikuti.kZ2

[0] RB Darlington (1970). Apakah Kurtosis Sungguh "Memuncak?". Ahli Statistik Amerika, Vol. 24, No. 2.

[1] JJA Moors (1986). Arti Kurtosis: Darlington Diperiksa Ulang. Ahli Statistik Amerika, Volume 40, Edisi 4.

pengguna603
sumber
1
Di mana-mana Anda menulis "bimodal", maksud Anda mungkin "unimodal"?
whuber
1
fμg(x)=(f(x)+f(2μx))/2.g1. Dengan demikian, setidaknya, kurtosis tidak mengatakan apa pun tentang bimodality. Karena tidak, tepatnya apa properti geometris dari pdf yang dijelaskan?
whuber
1
Kurtosis tidak menunjukkan bimodality, kecuali dalam kasus ekstrem di mana ia mendekati minimum, di mana ia menunjukkan sesuatu yang mirip dengan distribusi dua-titik yang dapat dilengkapi. Anda dapat memiliki distribusi bimodal dengan setiap nilai kurtosis yang memungkinkan. Lihat ncbi.nlm.nih.gov/pmc/articles/PMC4321753 untuk contoh.
Peter Westfall
1
ppv0
5

[NB ini ditulis sebagai jawaban atas pertanyaan lain di situs; jawabannya digabung dengan pertanyaan saat ini. Inilah sebabnya mengapa jawaban ini tampaknya menanggapi pertanyaan dengan kata yang berbeda. Namun banyak dari pos tersebut harus relevan di sini.]

Kurtosis tidak benar-benar mengukur bentuk distribusi. Dalam beberapa keluarga distribusi mungkin, Anda bisa mengatakan itu menggambarkan bentuk, tetapi lebih umum kurtosis tidak memberi tahu Anda banyak tentang bentuk sebenarnya. Bentuk dipengaruhi oleh banyak hal, termasuk hal-hal yang tidak terkait dengan kurtosis.

Jika seseorang mencari kurtosis, beberapa gambar seperti ini muncul:

hal

yang nampaknya menunjukkan variasi yang berubah, bukannya meningkatkan kurtosis. Sebagai perbandingan, inilah tiga kepadatan normal yang baru saja saya gambar (menggunakan R) dengan standar deviasi yang berbeda:

masukkan deskripsi gambar di sini

Seperti yang Anda lihat, tampilannya hampir identik dengan gambar sebelumnya. Semua ini memiliki kurtosis yang persis sama. Sebaliknya, inilah contoh yang mungkin lebih dekat dengan tujuan diagram

masukkan deskripsi gambar di sini

6

Inilah yang biasanya orang maksudkan ketika mereka berbicara tentang kurtosis yang menunjukkan bentuk kepadatan. Namun, kurtosis bisa halus - tidak harus bekerja seperti itu.

Misalnya, pada varian tertentu, kurtosis yang lebih tinggi sebenarnya dapat terjadi dengan puncak yang lebih rendah.

Kita juga harus waspada terhadap godaan (dan dalam beberapa buku dinyatakan secara terbuka) bahwa nol kelebihan kurtosis menyiratkan normalitas. Ada distribusi dengan kurtosis 0 berlebih yang tidak seperti normal. Ini sebuah contoh:

dgam 2.3

Memang, itu juga menggambarkan poin sebelumnya. Saya dapat dengan mudah membangun distribusi yang tampak serupa dengan kurtosis lebih tinggi dari normal tetapi yang masih nol di pusat - tidak adanya puncak sama sekali.

Ada sejumlah posting di situs yang menggambarkan kurtosis lebih lanjut. Salah satu contohnya ada di sini .

Glen_b -Reinstate Monica
sumber
Tapi saya tidak mengatakannya? Buku itu mengatakannya?
Stat Tistician
Saya tahu itu. Saya tidak pernah mengatakan Anda mengatakannya. Bagaimana Anda menyarankan saya menanggapi pernyataan yang salah dan terang-terangan yang Anda tanyakan? Hanya berpura-pura mereka tidak salah?
Glen_b -Reinstate Monica
1
@Glen_b Foto-foto itu bukan dari buku. Buku itu tidak memberikan ilustrasi. Saya menggunakan pencarian gambar goolge untuk ilustrasi ini.
Stat Tistician
2
Beberapa penulis menulis tentang kurtosis sebagai puncaknya dan beberapa menulisnya sebagai bobot ekor, tetapi interpretasi skeptis bahwa kurtosis adalah ukuran Kurtosis apa pun adalah satu-satunya cerita yang benar-benar aman. Contoh-contoh numerik yang diberikan oleh Irving Kaplansky (1945) saja sudah cukup untuk menunjukkan bahwa kurtosis tidak mengandung interpretasi yang tegas. (Makalah Kaplansky adalah salah satu dari sedikit yang ia tulis pada pertengahan 1940-an tentang probabilitas dan statistik. Ia jauh lebih dikenal sebagai algebraist terkemuka.) Referensi lengkap dan lebih banyak dalam stata-journal.com/sjpdf.html?articlenum=st0204
Nick Cox
1
Ada banyak buku dan makalah yang mengklaim bahwa kurtosis adalah puncaknya, jadi klausa pertama saya tetap benar dan dapat didukung sebagai pernyataan tentang apa yang ada dalam literatur. Yang lebih penting adalah bagaimana seseorang memandang contoh dan argumen Kaplansky.
Nick Cox
3

μ±σ

Sunting 11/23/2018: Sejak menulis posting ini, saya telah mengembangkan beberapa perspektif geometris tentang kurtosis. Salah satunya adalah bahwa kelebihan kurtosis memang dapat divisualisasikan secara geometris dalam hal penyimpangan dari garis 45 derajat yang diharapkan di ekor plot normal-kuantil normal; lihat Apakah plot QQ ini menunjukkan distribusi leptokurtik atau platykurtik?

pV(v)V={(Xμ)/σ}4XE(V)VX

μ±σXμ±σμσX0.25μ±σμσ

Peter Westfall
sumber
3
Daripada hanya terus merujuk orang ke makalah di sebagian besar posting Anda, maukah Anda meringkas argumen di sini? Lihat bantuan di sini di bawah "selalu berikan konteks untuk tautan", khususnya di mana dikatakan "selalu mengutip bagian penting". Ini tidak perlu mengutip secara harfiah di mana argumennya luas, tetapi setidaknya ringkasan dari argumen itu diperlukan. Anda cukup membuat beberapa pernyataan yang menyapu lalu menghubungkannya dengan kertas. Pernyataan bahwa kurtosis mengukur perilaku ekor adalah (konteks absen) menyesatkan (terbukti demikian)
Glen_b -Reinstate Monica
2
... tetapi tidak mungkin untuk tidak setuju dengan argumen yang tidak Anda sajikan di sini, dan mungkin sampai pada kesimpulan yang lebih bernuansa.
Glen_b -Reinstate Monica
Argumen saya jelas diletakkan di sini: en.wikipedia.org/wiki/... Komentar selamat datang! BTW, kurtosis adalah ukuran berat ekor, hanya saja tidak sama dengan yang lain yang telah dipertimbangkan. Ini mengukur berat ekor melalui E (Z ^ 4), yang merupakan ukuran berat ekor karena nilai | Z | <1 berkontribusi sangat sedikit untuk itu. Dengan logika yang sama, E (Z ^ n), untuk kekuatan genap yang lebih tinggi, juga merupakan ukuran bobot ekor.
Peter Westfall
Hai Peter, Silakan kunjungi stats.stackexchange.com/help/merging-accounts untuk menggabungkan akun Anda sehingga Anda dapat mengubah posting lama Anda.
Whuber
3

Jenis jawaban yang berbeda: Kita dapat menggambarkan kurtosis secara geometris, menggunakan ide dari http://www.quantdec.com/envstats/notes/class_06/properties.htm : momen grafis.

k=E(Xμσ)4=(xμσ)4f(x)dx
dimanafXμ,σ2x ke=k3

Berikut ini saya akan menunjukkan plot kurtosis grafis untuk beberapa distribusi simetris, semua berpusat pada nol dan diskalakan untuk memiliki varian 1.

kurtosis visual untuk beberapa distribusi simetris

Perhatikan tidak adanya kontribusi terhadap kurtosis dari pusat, yang menunjukkan bahwa kurtosis tidak ada hubungannya dengan "puncaknya".

kjetil b halvorsen
sumber
1
Tepat sekali. Area di bawah kurva yang Anda perlihatkan dari -1 hingga +1 adalah antara 0 dan 1 untuk semua distribusi, dan berada di antara 0 dan 0,5 untuk semua distribusi kontinu yang kepadatan berkurang pada kisaran [0,1]. Kedua teorema itu terbukti di makalah saya ncbi.nlm.nih.gov/pmc/articles/PMC4321753 . Teorema ketiga yang dibuktikan di dalamnya adalah bahwa, untuk setiap urutan distribusi yang kurtosisnya cenderung tak terbatas, rasio area di bawah kisaran dari - bZ2b+bb