Bagaimana cara memasukkan perkiraan PDF (yaitu: estimasi kepadatan) menggunakan momen k (empiris) pertama?

11

Saya memiliki situasi di mana saya dapat memperkirakan (yang pertama) k momen dari kumpulan data, dan ingin menggunakannya untuk menghasilkan estimasi fungsi kerapatan.

Saya sudah menemukan distribusi Pearson , tetapi menyadari itu hanya bergantung pada 4 momen pertama (dengan beberapa pembatasan pada kemungkinan kombinasi momen).

Saya juga mengerti bahwa setiap rangkaian momen yang terbatas tidak cukup untuk "menjabarkan" distribusi tertentu, ketika tidak menggunakan lebih banyak asumsi. Namun, saya masih ingin kelas distribusi yang lebih umum (selain keluarga distribusi Pearson). Melihat pertanyaan lain, saya tidak dapat menemukan distribusi seperti itu (lihat: di sini , di sini , di sini , di sini , di sini , dan di sini ).

Apakah ada keluarga distribusi umum ("sederhana") yang dapat didefinisikan untuk setiap momen ? (mungkin seperangkat transformasi yang dapat mengambil distribusi normal standar dan mengubahnya sampai menegaskan dengan semua rangkaian k momen)kk

(Saya tidak terlalu peduli jika kita menganggap momennya 0 atau tidak)k+1

Terima kasih.

ps: Saya akan senang untuk contoh yang diperluas. Lebih disukai dengan contoh kode R.

Tal Galili
sumber
2
kkE[Xk]=(i)kϕX(k)(0)k
Terima kasih @StephanKolassa - ada peluang untuk jawaban yang diperluas / contoh kode R?
Tal Galili
Dear @whuber, bisakah Anda menyarankan contoh kode R? (juga, apakah ini cocok dengan jawaban serigala?)
Tal Galili
Ini adalah pendekatan yang sangat berbeda dari jawaban itu.
Whuber

Jawaban:

11

Metode 1: Sistem Pearson tingkat tinggi

p(x)

dp(x)dx=(a+x)c0+c1x+c2x2p(x)

(a,c0,c1,c2)

c0+c1x+c2x2p(x)

dp(x)dx=(a+x)c0+c1x+c2x2+c3x3p(x)

yang menghasilkan solusi:

masukkan deskripsi gambar di sini

Saya memecahkan ini untuk bersenang-senang beberapa waktu lalu (memiliki kereta pemikiran yang sama dengan OP): derivasi dan solusi diberikan dalam Bab 5 buku kami; jika tertarik, unduhan gratis tersedia di sini:

http://www.mathstatica.com/book/bookcontents.html

Perhatikan bahwa sedangkan keluarga Pearson orde kedua (kuadratik) dapat dinyatakan dalam 4 momen pertama, keluarga tipe Pearson orde dua (kubik) membutuhkan 6 momen pertama.

Metode 2: Ekspansi Gram-Charlier

kth

Saat populasi atau momen sampel ??

Untuk sistem gaya Pearson: Jika momen populasi diketahui, maka menggunakan momen yang lebih tinggi seharusnya menghasilkan kecocokan yang lebih baik. Namun, jika data yang diamati adalah sampel acak yang diambil dari populasi, ada trade-off: polinomial orde tinggi menyiratkan bahwa momen orde yang lebih tinggi diperlukan, dan perkiraan yang terakhir mungkin tidak dapat diandalkan (memiliki varian tinggi), kecuali ukuran sampel 'besar'. Dengan kata lain, diberikan data sampel, pemasangan menggunakan momen yang lebih tinggi dapat menjadi 'tidak stabil' dan menghasilkan hasil yang lebih rendah. Hal yang sama berlaku untuk ekspansi Gram-Charlier: menambahkan istilah tambahan sebenarnya dapat menghasilkan kecocokan yang lebih buruk, sehingga diperlukan kehati-hatian.

serigala
sumber
Para serigala yang terhormat - terima kasih atas jawaban Anda! Jika saya mengerti Anda dengan benar, ekspansi Gram-Charlier lebih sesuai dengan apa yang saya cari (walaupun distribusi Pearson yang lebih umum menarik untuk diketahui). Saya melihat buku Anda (bab 5, mulai dari halaman 175), dan melihat Anda memang memberikan deskripsi yang terperinci (dengan juga menyebutkan bagaimana menangani perkiraan momen, yang merupakan kasus saya). Satu-satunya hal adalah saya tidak bisa menggunakan kode Anda (karena saya pengguna R). Terima kasih atas jawaban Anda (dan juga untuk buku Anda yang tampaknya mengesankan dan menarik secara umum)
Tal Galili
2
Baru saja menemukan paket R untuk menangani berbagai metode: cran.us.r-project.org/web/packages/PDQutils/vignettes/…
Tal Galili