Estimasi yang kuat tentang kurtosis?

11

Saya menggunakan estimator biasa untuk kurtosis, , tapi saya perhatikan bahwa bahkan 'outlier' kecil dalam distribusi empiris saya , yaitu puncak kecil jauh dari pusat, sangat mempengaruhinya. Apakah ada estimator kurtosis yang lebih kuat?

K^=μ^4σ^4
yoki
sumber

Jawaban:

8

Ada beberapa. Anda akan menemukan perbandingan lengkap dalam tautan ini dengan versi makalah yang tidak sesuai (referensi yang tepat di bagian bawah jawaban ini).

Karena kendala masalah, pemecahan yang paling kuat dari algoritma ini (L / RMC) paling banyak 12,5%. Keuntungan L / RMC adalah bahwa ia didasarkan pada kuantil dan tetap dapat ditafsirkan bahkan ketika distribusi yang mendasarinya tidak memiliki momen. Keuntungan lain adalah bahwa ia tidak mengasumsikan simetri distribusi bagian yang tidak terkontaminasi dari data untuk mengukur berat ekor: pada kenyataannya, algoritma mengembalikan dua angka: RMC untuk berat ekor kanan dan LMC untuk berat ekor kiri.

[0,1]oleh konstruksi: tidak ada jumlah kontaminasi yang dapat menyebabkan algoritma untuk mengembalikan -1!). Dalam praktiknya, seseorang menemukan bahwa seseorang dapat mengganti sekitar 5% sampel dengan bahkan pencilan yang sangat patologis tanpa menyebabkan perkiraan yang paling terpengaruh (selalu ada dua) menyimpang terlalu banyak dari nilai yang ada pada sampel yang tidak terkontaminasi.

L / RMC juga diterapkan secara luas. Misalnya Anda dapat menemukan implementasi R di sini . Seperti yang dijelaskan dalam artikel yang ditautkan di atas, untuk menghitung L / RMC, Anda perlu menghitung MC (estimator yang diterapkan dalam tautan) secara terpisah di bagian kiri dan kanan data Anda. Di sini, (kiri) setengah kanan adalah sub-sampel yang terbentuk dari pengamatan (lebih kecil) lebih besar dari median sampel asli Anda.

  • Brys, Hubert, Struyf. (2006). Ukuran Berat Ekor yang Kuat.
pengguna603
sumber
2
Bukankah ini ukuran alternatif dari berat ekor daripada penduga yang kuat tentang kurtosis per katakan? Ini mungkin yang dia inginkan. tapi bukan itu yang dia minta. Apakah ada / semua penaksir ini konvergen ke kurtosis untuk sampel besar?
andrewH
Ringkasan dari makalah: Pada data yang tidak terkontaminasi memuaskan kondisi pada pemesanan cembung Van Zwet (di mana ukuran kurtosis bermakna) mereka bertemu dengan fungsi monoton kurtosis.
user603
1
Kurtosis Pearson mengukur pencilan (pengamatan ekstrim yang jarang), sederhana dan sederhana. Jadi, apa yang Anda cari? Ukuran "puncaknya"? Pertama, itu sama sekali tidak sesuai dengan apa yang diukur oleh Kurson. Kedua, jika Anda menginginkan ukuran "puncaknya", Anda harus terlebih dahulu mendefinisikan apa artinya. Jika Anda bisa mendefinisikannya, Anda bisa memperkirakannya. Satu kemungkinan adalah turunan kedua dari pdf dari data terstandarisasi, dievaluasi pada puncaknya. (Sama-sama). Saya yakin ada yang lain.
Peter Westfall
1
Sebenarnya, saya memberikan tiga teorema matematika yang menghubungkan kurtosis dengan ekor distribusi, sehingga ini tidak dapat dipalsukan: (i) Untuk semua distribusi dengan momen keempat hingga, kurtosis adalah antara E (Z ^ 4 * I (| Z |> 1 )) dan E (Z ^ 4 * I (| Z |> 1)) +1. (ii) Dalam sub-kelas yang kerapatan Z ^ 2 kontinu dan menurun pada (0,1), "+1" dapat diganti dengan "+5". (iii) Untuk setiap urutan distribusi yang memiliki kurtosis -> infinity, E (Z ^ 4 * I (| Z |> b)) / kurtosis -> 1, untuk setiap b nyata. Semuanya ada di sini: ncbi.nlm.nih.gov/pmc/articles/PMC4321753
Peter Westfall