Saya memiliki situasi di mana saya dapat memperkirakan (yang pertama) momen dari kumpulan data, dan ingin menggunakannya untuk menghasilkan estimasi fungsi kerapatan.
Saya sudah menemukan distribusi Pearson , tetapi menyadari itu hanya bergantung pada 4 momen pertama (dengan beberapa pembatasan pada kemungkinan kombinasi momen).
Saya juga mengerti bahwa setiap rangkaian momen yang terbatas tidak cukup untuk "menjabarkan" distribusi tertentu, ketika tidak menggunakan lebih banyak asumsi. Namun, saya masih ingin kelas distribusi yang lebih umum (selain keluarga distribusi Pearson). Melihat pertanyaan lain, saya tidak dapat menemukan distribusi seperti itu (lihat: di sini , di sini , di sini , di sini , di sini , dan di sini ).
Apakah ada keluarga distribusi umum ("sederhana") yang dapat didefinisikan untuk setiap momen ? (mungkin seperangkat transformasi yang dapat mengambil distribusi normal standar dan mengubahnya sampai menegaskan dengan semua rangkaian k momen)
(Saya tidak terlalu peduli jika kita menganggap momennya 0 atau tidak)
Terima kasih.
ps: Saya akan senang untuk contoh yang diperluas. Lebih disukai dengan contoh kode R.
sumber
Jawaban:
Metode 1: Sistem Pearson tingkat tinggi
yang menghasilkan solusi:
Saya memecahkan ini untuk bersenang-senang beberapa waktu lalu (memiliki kereta pemikiran yang sama dengan OP): derivasi dan solusi diberikan dalam Bab 5 buku kami; jika tertarik, unduhan gratis tersedia di sini:
http://www.mathstatica.com/book/bookcontents.html
Perhatikan bahwa sedangkan keluarga Pearson orde kedua (kuadratik) dapat dinyatakan dalam 4 momen pertama, keluarga tipe Pearson orde dua (kubik) membutuhkan 6 momen pertama.
Metode 2: Ekspansi Gram-Charlier
Saat populasi atau momen sampel ??
Untuk sistem gaya Pearson: Jika momen populasi diketahui, maka menggunakan momen yang lebih tinggi seharusnya menghasilkan kecocokan yang lebih baik. Namun, jika data yang diamati adalah sampel acak yang diambil dari populasi, ada trade-off: polinomial orde tinggi menyiratkan bahwa momen orde yang lebih tinggi diperlukan, dan perkiraan yang terakhir mungkin tidak dapat diandalkan (memiliki varian tinggi), kecuali ukuran sampel 'besar'. Dengan kata lain, diberikan data sampel, pemasangan menggunakan momen yang lebih tinggi dapat menjadi 'tidak stabil' dan menghasilkan hasil yang lebih rendah. Hal yang sama berlaku untuk ekspansi Gram-Charlier: menambahkan istilah tambahan sebenarnya dapat menghasilkan kecocokan yang lebih buruk, sehingga diperlukan kehati-hatian.
sumber