Saya punya sampel yang merupakan vektor dengan 220 angka. Berikut ini tautan ke histogram data saya. . Dan saya ingin memeriksa apakah data saya cocok dengan distribusi Pareto, tetapi saya tidak ingin melihat plot QQ dengan distribusi itu, tetapi saya membutuhkan jawaban yang tepat dengan nilai-p dalam R, seperti uji Anderson-Darling untuk normalitas ( ad.test
) . Bagaimana saya bisa melakukan itu? Harap sespesifik mungkin.
r
distributions
pareto-distribution
bersabar
sumber
sumber
Jawaban:
(PS) Pertama-tama saya pikir Glen_b tepat di komentar di atas nya pada kegunaan tes seperti: data riil yang pasti tidak persis Pareto didistribusikan, dan untuk aplikasi praktis yang paling pertanyaan akan "seberapa baik adalah pendekatan Pareto?" - dan plot QQ adalah cara yang baik untuk menunjukkan kualitas perkiraan seperti itu.
Cara apa pun yang dapat Anda lakukan dengan statistik Kolmogorov-Smirnov, setelah memperkirakan parameter dengan kemungkinan maksimum. Estimasi parameter ini mencegah untuk menggunakan -value , sehingga Anda dapat melakukan bootstrap parametrik untuk memperkirakannya. Seperti yang Glen_b katakan dalam komentar, ini dapat dihubungkan ke tes Lilliefors .p
ks.test
Berikut adalah beberapa baris kode R.
Pertama-tama tentukan fungsi dasar untuk menangani distribusi Pareto.
Fungsi berikut menghitung MLE dari parameter (justifikasi dalam Wikipedia ).
Dan fungsi ini menghitung statistik KS, dan menggunakan bootstrap parametrik untuk memperkirakan nilai- .p
Sekarang, misalnya, sampel yang berasal dari distribusi Pareto:
... dan dari a :χ2(2)
Perhatikan bahwa saya tidak mengklaim bahwa tes ini tidak bias: ketika sampel kecil, beberapa bias mungkin ada. Bootstrap parametrik tidak memperhitungkan ketidakpastian pada estimasi parameter (pikirkan apa yang akan terjadi ketika menggunakan strategi ini untuk menguji secara naif jika rata-rata dari beberapa variabel normal dengan varian yang tidak diketahui adalah nol).
PS Wikipedia mengatakan beberapa kata tentang ini. Berikut adalah dua pertanyaan lain yang disarankan untuk strategi yang serupa: Uji goodness of fit untuk campuran , uji goodness of fit untuk distribusi gamma .
sumber