Sudah, katakanlah, data berikut:
8232302 684531 116857 89724 82267 75988 63871
23718 1696 436 439 248 235
Ingin cara sederhana untuk menyesuaikan ini (dan beberapa set data lainnya) ke distribusi Pareto. Idealnya itu akan menghasilkan nilai teoritis yang cocok, kurang ideal parameternya.
r
pareto-distribution
Felix
sumber
sumber
Jawaban:
Nah, jika Anda memiliki sampel dari distribusi pareto dengan parameter dan (di mana adalah parameter batas bawah dan adalah parameter bentuk) log-kemungkinan itu sampel adalah: m > 0 α > 0 m αX1,...,Xn m>0 α > 0 m α
ini adalah peningkatan monoton dalam , sehingga maximizer adalah nilai terbesar yang konsisten dengan data yang diamati. Karena parameter mendefinisikan batas bawah dukungan untuk distribusi Pareto, maka yang optimal adalahmm m
yang tidak bergantung pada . Selanjutnya, menggunakan trik kalkulus biasa, MLE untuk harus dipenuhiαα α
beberapa aljabar sederhana memberitahu kita MLE dari adalahα
Dalam banyak hal penting (misalnya efisiensi asimptotik optimal karena mencapai batas bawah Cramer-Rao), ini adalah cara terbaik untuk menyesuaikan data ke distribusi Pareto. Kode R di bawah ini menghitung MLE untuk set data yang diberikan
X
,.Sunting: Berdasarkan komentar oleh @cardinal dan I di bawah ini, kami juga dapat mencatat bahwa adalah kebalikan dari mean sampel dari , yang kebetulan memiliki distribusi eksponensial. Oleh karena itu, jika kita memiliki akses ke perangkat lunak yang sesuai dengan distribusi eksponensial (yang lebih mungkin, karena tampaknya muncul dalam banyak masalah statistik), maka pemasangan distribusi Pareto dapat dilakukan dengan mengubah kumpulan data dengan cara ini dan memasangnya. ke distribusi eksponensial pada skala transformasi. log(Xi/ m )α^ log(Xi/m^)
sumber
Anda dapat menggunakan
fitdist
fungsi yang disediakan dalamfitdistrplus
paket:sumber
library(fitdistrplus)
?library(actuar)
diperlukan agar ini berfungsi.