"Estimasi kepadatan kernel" adalah konvolusi dari apa?

25

Saya mencoba untuk mendapatkan pemahaman yang lebih baik tentang estimasi kepadatan kernel.

Menggunakan definisi dari Wikipedia: https://en.wikipedia.org/wiki/Kernel_density_estimation#Definition

fh^(x)=1ni=1nKh(xxi)=1nhi=1nK(xxih)

Mari kita ambil K() menjadi fungsi persegi panjang yang memberikan 1 jika x adalah antara 0.5 dan 0.5 dan 0 sebaliknya, dan h (ukuran jendela) menjadi 1.

Saya mengerti bahwa kepadatan adalah konvolusi dari dua fungsi, tetapi saya tidak yakin saya tahu bagaimana mendefinisikan kedua fungsi ini. Salah satunya harus (mungkin) menjadi fungsi dari data yang, untuk setiap titik dalam R, memberi tahu kami berapa banyak titik data yang kami miliki di lokasi tersebut (kebanyakan 0 ). Dan fungsi lainnya mungkin harus beberapa modifikasi dari fungsi kernel, dikombinasikan dengan ukuran jendela. Tetapi saya tidak yakin bagaimana mendefinisikannya.

Ada saran?

Di bawah ini adalah contoh kode R yang (saya curiga) mereplikasi pengaturan yang saya tetapkan di atas (dengan campuran dua Gaussi dan n=100 ), di mana saya berharap melihat "bukti" bahwa fungsi yang akan berbelit-belit adalah seperti yang kita duga .

# example code:
set.seed(2346639)
x <- c(rnorm(50), rnorm(50,2))
plot(density(x, kernel='rectangular', width=1, n = 10**4))
rug(x)

masukkan deskripsi gambar di sini

Tal Galili
sumber
3
Permadani di bagian bawah memberikan intuisi yang kasar. Bayangkan setiap nilai dari i = 1 ke n adalah lonjakan dengan bobot terkait 1 / n . Sekarang usap setiap lonjakan menggunakan bentuk dan lebar kernel Anda, sehingga lonjakan diubah untuk mengambil bentuk dan lebar yang sama, dengan ketinggian sedemikian sehingga area di bawah ini adalah 1 / n . Tambahkan hasilnya dan Anda memiliki perkiraan kepadatan kernel. xii=1n1/n1/n
Nick Cox
Hai Nick, terima kasih atas komentarnya. Sejauh ini dalam intuisi yang sudah saya dapatkan, itu adalah mengubahnya secara resmi menjadi bentuk konvolusi yang saya ingin tahu :) (Saya ingin sekarang pergi melalui jawaban Whuber!)
Tal Galili

Jawaban:

27

Sesuai dengan kumpulan data apa pun X=(x1,x2,,xn) adalah "fungsi kepadatan empiris" -nya

fX(x)=1ni=1nδ(xxi).

Di sini, δ adalah "fungsi umum". Terlepas dari nama itu, itu sama sekali bukan fungsi: itu adalah objek matematika baru yang hanya dapat digunakan dalam integral. Properti definisinya adalah bahwa untuk setiap fungsi g dukungan kompak yang kontinu dalam lingkungan 0 ,

Rδ(x)g(x)dx=g(0).

(Nama untuk δ termasuk ukuran "atom" atau "titik" dan " Fungsi delta Dirac ." Dalam perhitungan berikut konsep ini diperluas untuk mencakup fungsi g yang kontinu dari satu sisi saja.)

Membenarkan karakterisasi fX ini adalah pengamatan itu

xfX(y)dy=x1ni=1nδ(yxi)dy=1ni=1nxδ(yxi)dy=1ni=1nRI(yx)δ(yxi)dy=1ni=1nI(xix)=FX(x)

FXI10RIX

fX(x)k

(fXk)(x)=RfX(xy)k(y)dy=R1ni=1nδ(xyxi)k(y)dy=1ni=1nRδ(xyxi)k(y)dy=1ni=1nk(xix).

k(x)=Kh(x)Kh(x)

whuber
sumber
1
Situasi dalam dua dimensi dijelaskan (dalam istilah sehari-hari) dan diilustrasikan pada situs GIS di gis.stackexchange.com/questions/14374/… .
whuber
1
Dear Whuber, saya baru saja membaca dan membaca jawaban Anda dengan senang hati! Terima kasih banyak atas penjelasan dan detailnya, jawaban Anda (yang ini, dan yang lainnya secara umum) benar-benar menginspirasi. Milik Anda, Tal
Tal Galili
1
δg,xig(xi).
1
@whuber Terima kasih. Kalimat Fungsi umum δ sama sekali bukan fungsi: ini adalah objek matematika baru yang hanya dapat digunakan dalam integral. membuatnya lebih jelas. tepat seperti biasa. ;)
Jan Vainer
1
@ Jan Terima kasih atas bantuan Anda: Saya telah memasukkan ide itu dalam jawaban ini.
whuber