Saya telah melihat sejumlah literatur yang masuk akal tentang bagaimana memilih kernel dan bandwidth ketika menghitung estimasi kepadatan kernel, tetapi saya saat ini tertarik pada bagaimana meningkatkan waktu yang diperlukan untuk mengevaluasi KDE yang dihasilkan pada jumlah titik yang berubah-ubah.
Dalam kasus saya, saya menggunakan kernel Gaussian multidimensi (2D atau 3D) dengan kovarians diagonal (yaitu masing-masing dimensi independen). Bandwidth di setiap dimensi mungkin berbeda dan dipilih menggunakan tetangga terdekat. Namun, pertanyaan saya mungkin meluas ke kernel yang berbeda dan metode pemilihan bandwidth.
Katakanlah saya memiliki poin data dan ingin mengevaluasi KDE yang dihasilkan di titik-titik grid. Implementasi sederhana melibatkan mengevaluasi multivariat normal pdf kali. Untuk tujuan saya, dan berada di urutan ribuan, dan evaluasi telah menjadi hambatan dalam kode saya.
Saya tidak mengetahui apakah ada perbaikan yang diterima secara umum untuk metode dasar ini. Saya menemukan makalah ini , yang mengklaim mengurangi kompleksitas dari ke . Namun, metode ini belum diimplementasikan dalam pustaka R atau Python 'standar' yang saya ketahui - yang menunjukkan bahwa itu belum diadopsi secara luas?
Terima kasih atas petunjuk yang dapat Anda berikan.
sumber