Seperti diketahui untuk distribusi normal, 68% dari massa probabilitas berada dalam satu standar deviasi dari rata-rata, 95% dalam dua standar deviasi dan 99,7% dalam 3 standar deviasi.
Namun, saya memiliki beberapa distribusi empiris yang leptokurtik dan condong negatif. Dalam keadaan seperti itu, adakah formula yang didasarkan pada momen tingkat tinggi untuk menghitung berapa besar massa probabilitas dalam begitu banyak standar deviasi mean?
Saya memiliki ukuran dan ingin memberikan beberapa pengertian tentang seberapa jauh dari titik tengah (rata-rata atau ukuran lain dari kecenderungan sentral).
Bisakah ini dilakukan?
Jawaban:
Anda selalu dapat menghitung berapa banyak nilai SD dari mean dengan hanya memasukkan nilai sampel, (nilai− mean) / SD, dan kemudian binning dan menghitung.
Fakta numerik yang tepat seperti yang Anda kutip untuk yang normal (Gaussian) secara umum tergantung pada mengetahui satu atau lebih dari fungsi kepadatan, distribusi atau kuantil, secara numerik jika tidak secara analitik.
Namun, tidak ada hubungan umum yang tersedia hanya dengan mengetahui kecenderungan atau kurtosis. Skewness dan kurtosis tidak menunjukkan bentuk distribusi secara umum, karena momen yang lebih tinggi dapat bervariasi juga.
sumber
Berikut ini adalah jawaban tepat yang menunjukkan bahwa median penyimpangan absolut dari rata-rata tidak selalu terkait dengan kurtosis.
Pertimbangkan keluarga distribusiX=μ+σZ dimana Z memiliki distribusi diskrit
Keluarga distribusi dariX diindeks oleh tiga parameter: μ , σ , dan θ , dengan rentang (−∞,+∞) , (0,+∞) dan (0,.5) .
Di keluarga ini,E(X)=μ , Var(X)=σ2 , dan deviasi absolut median dari mean adalah 0.5σ .
Kurtosis dariX adalah sebagai berikut:
kurtosis=E(Z4)=.54∗.5+1.24∗(.5−θ)+(0.155/θ+1.44)2∗θ .
Di dalam keluarga ini,
(i) kurtosis cenderung hingga tak terbatasθ→0 .
(ii) distribusi dalam "bahu" (yaitu, dalamμ±σ range) konstan untuk semua nilai kurtosis; itu hanyalah dua poinμ±σ/2 , wp 0.25 setiap. Ini memberikan contoh tandingan terhadap satu interpretasi kurtosis, yang menyatakan bahwa kurtosis yang lebih besar menyiratkan pergerakan massa menjauh dari bahu, secara bersamaan ke dalam rentang antara bahu dan ke ekor.
(iii) "puncak" dari distribusi juga konstan untuk semua nilai kurtosis; sekali lagi, ini hanyalah dua poinμ±σ/2 , wp 0.25 setiap. Ini memberikan contoh tandingan terhadap interpretasi yang sering diberikan tetapi jelas tidak benar bahwa kurtosis yang lebih besar menyiratkan distribusi yang lebih "memuncak".
Dalam keluarga ini, porsi sentral dari distribusi sebenarnya menjadi lebih datar dengan meningkatnya kurtosis, karena probabilitasnya terus berlanjutμ±1.2σ dan μ±0.5σ konvergen ke nilai yang sama, 0.25 , dengan meningkatnya kurtosis.
(iv) Penyimpangan absolut median dari rata-rata adalah konstan0.5σ , untuk semua nilai kurtosis.
sumber