Saya menggunakan estimator biasa untuk kurtosis, , tapi saya perhatikan bahwa bahkan 'outlier' kecil dalam distribusi empiris saya , yaitu puncak kecil jauh dari pusat, sangat mempengaruhinya. Apakah ada estimator kurtosis yang lebih kuat?
Ada beberapa. Anda akan menemukan perbandingan lengkap dalam tautan ini dengan versi makalah yang tidak sesuai (referensi yang tepat di bagian bawah jawaban ini).
Karena kendala masalah, pemecahan yang paling kuat dari algoritma ini (L / RMC) paling banyak 12,5%. Keuntungan L / RMC adalah bahwa ia didasarkan pada kuantil dan tetap dapat ditafsirkan bahkan ketika distribusi yang mendasarinya tidak memiliki momen. Keuntungan lain adalah bahwa ia tidak mengasumsikan simetri distribusi bagian yang tidak terkontaminasi dari data untuk mengukur berat ekor: pada kenyataannya, algoritma mengembalikan dua angka: RMC untuk berat ekor kanan dan LMC untuk berat ekor kiri.
oleh konstruksi: tidak ada jumlah kontaminasi yang dapat menyebabkan algoritma untuk mengembalikan -1!). Dalam praktiknya, seseorang menemukan bahwa seseorang dapat mengganti sekitar 5% sampel dengan bahkan pencilan yang sangat patologis tanpa menyebabkan perkiraan yang paling terpengaruh (selalu ada dua) menyimpang terlalu banyak dari nilai yang ada pada sampel yang tidak terkontaminasi.
L / RMC juga diterapkan secara luas. Misalnya Anda dapat menemukan implementasi R di sini . Seperti yang dijelaskan dalam artikel yang ditautkan di atas, untuk menghitung L / RMC, Anda perlu menghitung MC (estimator yang diterapkan dalam tautan) secara terpisah di bagian kiri dan kanan data Anda. Di sini, (kiri) setengah kanan adalah sub-sampel yang terbentuk dari pengamatan (lebih kecil) lebih besar dari median sampel asli Anda.