Skewness, kurtosis dan berapa banyak nilai standar deviasi berasal dari rata-rata

8

Seperti diketahui untuk distribusi normal, 68% dari massa probabilitas berada dalam satu standar deviasi dari rata-rata, 95% dalam dua standar deviasi dan 99,7% dalam 3 standar deviasi.

Namun, saya memiliki beberapa distribusi empiris yang leptokurtik dan condong negatif. Dalam keadaan seperti itu, adakah formula yang didasarkan pada momen tingkat tinggi untuk menghitung berapa besar massa probabilitas dalam begitu banyak standar deviasi mean?

Saya memiliki ukuran dan ingin memberikan beberapa pengertian tentang seberapa jauh dari titik tengah (rata-rata atau ukuran lain dari kecenderungan sentral).

Bisakah ini dilakukan?

Baz
sumber
Tanpa beberapa asumsi tambahan Anda tidak dapat melakukan banyak hal. Lihat, misalnya, banyak contoh distribusi dengan kemiringan dan kurtosis yang sama dengan yang normal di sini ; mereka memiliki beragam perilaku kuantil yang berbeda (tanpa ada upaya apa pun di sana untuk mengeksplorasi kemungkinan perilaku itu). Efek serupa terjadi pada nilai skewness dan kurtosis lainnya.
Glen_b -Reinstate Monica

Jawaban:

8

Anda selalu dapat menghitung berapa banyak nilai SD dari mean dengan hanya memasukkan nilai sampel, (nilai mean) / SD, dan kemudian binning dan menghitung.

Fakta numerik yang tepat seperti yang Anda kutip untuk yang normal (Gaussian) secara umum tergantung pada mengetahui satu atau lebih dari fungsi kepadatan, distribusi atau kuantil, secara numerik jika tidak secara analitik.

Namun, tidak ada hubungan umum yang tersedia hanya dengan mengetahui kecenderungan atau kurtosis. Skewness dan kurtosis tidak menunjukkan bentuk distribusi secara umum, karena momen yang lebih tinggi dapat bervariasi juga.

Nick Cox
sumber
0

Berikut ini adalah jawaban tepat yang menunjukkan bahwa median penyimpangan absolut dari rata-rata tidak selalu terkait dengan kurtosis.

Pertimbangkan keluarga distribusi X=μ+σZdimana Z memiliki distribusi diskrit

Z=0.5, dengan probabilitas (wp) .25

=+0.5, wp .25

=1.2, wp .25θ/2

=+1.2, wp .25θ/2

=0.155/θ+1.44, wp θ/2

=+0.155/θ+1.44, wp θ/2.

Keluarga distribusi dari X diindeks oleh tiga parameter: μ, σ, dan θ, dengan rentang (,+), (0,+) dan (0,.5).

Di keluarga ini, E(X)=μ, Var(X)=σ2, dan deviasi absolut median dari mean adalah 0.5σ.

Kurtosis dari X adalah sebagai berikut:

kurtosis =E(Z4)=.54.5+1.24(.5θ)+(0.155/θ+1.44)2θ.

Di dalam keluarga ini,

(i) kurtosis cenderung hingga tak terbatas θ0.

(ii) distribusi dalam "bahu" (yaitu, dalam μ±σrange) konstan untuk semua nilai kurtosis; itu hanyalah dua poinμ±σ/2, wp 0.25setiap. Ini memberikan contoh tandingan terhadap satu interpretasi kurtosis, yang menyatakan bahwa kurtosis yang lebih besar menyiratkan pergerakan massa menjauh dari bahu, secara bersamaan ke dalam rentang antara bahu dan ke ekor.

(iii) "puncak" dari distribusi juga konstan untuk semua nilai kurtosis; sekali lagi, ini hanyalah dua poinμ±σ/2, wp 0.25setiap. Ini memberikan contoh tandingan terhadap interpretasi yang sering diberikan tetapi jelas tidak benar bahwa kurtosis yang lebih besar menyiratkan distribusi yang lebih "memuncak".

Dalam keluarga ini, porsi sentral dari distribusi sebenarnya menjadi lebih datar dengan meningkatnya kurtosis, karena probabilitasnya terus berlanjut μ±1.2σ dan μ±0.5σ konvergen ke nilai yang sama, 0.25, dengan meningkatnya kurtosis.

(iv) Penyimpangan absolut median dari rata-rata adalah konstan 0.5σ, untuk semua nilai kurtosis.

Peter Westfall
sumber