Estimasi kepadatan kernel pada distribusi asimetris

10

Biarkan menjadi pengamatan yang diambil dari distribusi probabilitas yang tidak diketahui (tetapi tentu saja asimetris).{x1,...,xN}

Saya ingin menemukan distribusi probabilitas dengan menggunakan pendekatan Namun, saya mencoba menggunakan kernel Gaussian, tetapi kinerjanya buruk, karena simetris. Jadi, saya telah melihat bahwa beberapa karya tentang kernel Gamma dan Beta telah dirilis, meskipun saya tidak mengerti bagaimana cara mengoperasikannya.

f^(x)=1Nhsaya=1NK(x-xsayah)

Pertanyaan saya adalah: bagaimana menangani kasus asimetris ini, seandainya dukungan distribusi yang mendasarinya tidak dalam interval ?[0,1]

Eleanore
sumber
4
Dalam kasus kepadatan yang dekat dengan lognormal (yang saya temui banyak di beberapa aplikasi tertentu), saya hanya mengubah (dengan mengambil log) dan kemudian melakukan KDE, dan kemudian mengubah kembali KDE (Anda perlu mengingat Jacobian ketika mengubah estimasi kembali). Ini bekerja dengan sangat baik dalam hal ini.
Glen_b -Reinstate Monica
@ Glen_b apakah Anda memiliki referensi atau materi di mana metode ini dijelaskan? (Menghitung KDE pada transformasi variabel asli dan kemudian mengubah kembali KDE)
boscovich
Bukan yang saya tahu - saya yakin mereka ada, karena itu ide yang agak sepele, dan mudah diimplementasikan. Ini semacam hal yang saya harapkan dari statistik undergrad untuk diturunkan. Dalam praktiknya itu bekerja dengan sangat baik.
Glen_b -Reinstate Monica
@ glen_b terima kasih. Jadi jika saya menggunakannya dalam laporan teknis / publikasi, apakah menurut Anda tidak masalah untuk tidak memberikan referensi?
boscovich
1
@ guy Tentu saja mungkin ada masalah, terutama dengan beberapa transformasi dan beberapa jenis data. Situasi yang saya gunakan cenderung cukup dekat dengan lognormal, dan ada perubahan bandwidth yang Anda lihat sebagai masalah persis apa yang dibutuhkan; itu jauh lebih baik daripada KDE pada data mentah. Dari uraian OP itu terdengar sangat mirip, tapi bukan berarti saya menyarankan itu adalah obat mujarab .
Glen_b -Reinstate Monica

Jawaban:

5

Pertama-tama, KDE dengan kernel simetris juga dapat bekerja dengan sangat baik ketika data Anda asimetris. Kalau tidak, sebenarnya akan sama sekali tidak berguna dalam praktek.

catatan(x)

Memiliki QUIT - Anony-Mousse
sumber
Jika Anda log(x)mengubah skala menjadi , apakah Anda juga perlu memperhitungkan jacobian?
DilithiumMatrix
0

Hmm. Anda mungkin menginginkan lebar kernel yang berubah sebagai fungsi lokasi.

Jika saya melihat masalah di eCDF maka saya mungkin mencoba dan membuat kemiringan numerik CDF berhubungan dengan ukuran Kernel.

Saya pikir jika Anda akan melakukan transformasi koordinat, maka Anda harus memiliki ide yang bagus tentang titik awal dan akhir. Jika Anda mengetahui distribusi target dengan baik, maka Anda tidak memerlukan pendekatan Kernel.

EngrStudent
sumber
1
Saya bisa dengan mudah mengetahui RVs saya tidak asli tetapi masih menginginkan KDE.
pria