Memilih bandwidth untuk penduga kepadatan kernel

29

Untuk penduga kepadatan kernel (KDE) univariat, saya menggunakan aturan Silverman untuk menghitung :h

0.9min(sd,IQR/1.34)×n0.2

Apa aturan standar untuk KDE multivarian (dengan asumsi kernel Normal).

csgillespie
sumber

Jawaban:

20

Untuk KDE univariat, Anda lebih baik menggunakan sesuatu selain aturan Silverman yang didasarkan pada perkiraan normal. Salah satu pendekatan yang sangat baik adalah metode Sheather-Jones, mudah diimplementasikan dalam R; sebagai contoh,

plot(density(precip, bw="SJ"))

Situasi untuk multivarian KDE tidak dipelajari dengan baik, dan alat-alatnya tidak begitu matang. Daripada bandwidth, Anda membutuhkan matriks bandwidth. Untuk menyederhanakan masalah, kebanyakan orang mengasumsikan matriks diagonal, meskipun ini mungkin tidak mengarah pada hasil terbaik. The ks paket di R menyediakan beberapa alat yang sangat berguna termasuk memungkinkan penuh (tidak harus diagonal) matriks bandwidth.

Rob Hyndman
sumber
3

Untuk estimasi kepadatan kernel univariat, bandwidth dapat diestimasi dengan aturan referensi Normal atau metode Cross Validation atau pendekatan plug-in.

Untuk estimasi kepadatan kernel multivariat, metode pemilihan bandwidth Bayesian dapat digunakan, lihat Zhang, X., ML King dan RJ Hyndman (2006), Suatu pendekatan Bayesian untuk pemilihan bandwidth untuk estimasi kepadatan kernel multivariat, Statistik Komputasi dan Analisis Data, 50, 3009-3031

Gabriel
sumber