Saya sudah mulai bekerja dengan cara saya melalui Tutorial Statistik Data Mining oleh Andrew Moore (sangat disarankan untuk orang lain yang pertama kali menjelajah ke bidang ini). Saya mulai dengan membaca PDF yang sangat menarik ini yang berjudul "Tinjauan Pengantar tentang algoritma pendeteksian anomali berbasis time-series" di mana Moore menelusuri banyak teknik yang digunakan dalam pembuatan algoritma untuk mendeteksi wabah penyakit. Di tengah-tengah slide, di halaman 27, ia mendaftar sejumlah "metode canggih" lainnya yang digunakan untuk mendeteksi wabah. Yang pertama terdaftar adalah wavelet . Wikipeida menggambarkan wavelet sebagai
osilasi seperti gelombang dengan amplitudo yang dimulai dari nol, meningkat, dan kemudian menurun kembali ke nol. Ini biasanya dapat divisualisasikan sebagai "osilasi singkat"
tetapi tidak menjelaskan aplikasi mereka ke statistik dan pencarian Google saya menghasilkan makalah yang sangat akademis yang mengasumsikan pengetahuan tentang bagaimana wavelet berhubungan dengan statistik atau buku lengkap tentang masalah ini.
Saya ingin pemahaman dasar tentang bagaimana wavelet diterapkan pada deteksi anomali time-series, seperti cara Moore menggambarkan teknik-teknik lain dalam tutorialnya. Dapatkah seseorang memberikan penjelasan tentang bagaimana metode deteksi menggunakan wavelet bekerja atau tautan ke artikel yang dapat dimengerti tentang masalah ini?
sumber
Fungsi-fungsi dasar wavelet diskrit yang paling umum digunakan (berbeda dari CWT yang dijelaskan dalam jawaban Robin) memiliki dua properti bagus yang membuatnya berguna untuk deteksi anomali:
Apa artinya ini secara praktis adalah bahwa dekomposisi wavelet diskrit Anda melihat perubahan lokal pada sinyal di berbagai skala dan pita frekuensi. Jika Anda memiliki (misalnya) noise berskala besar, frekuensi tinggi ditumpangkan melintasi fungsi yang menampilkan pergeseran magnitudo rendah dalam periode yang lebih lama, transformasi wavelet akan secara efisien memisahkan kedua skala ini dan memungkinkan Anda melihat perubahan garis dasar yang banyak teknik akan ketinggalan; perubahan dalam garis dasar ini dapat menyarankan wabah penyakit atau perubahan minat lainnya. Dalam banyak hal, Anda dapat memperlakukan dekomposisi itu sendiri sebagai lebih halus (dan ada cukup banyak pekerjaan yang dilakukan pada penyusutan yang efisien untuk koefisien wavelet dalam estimasi nonparametrik, lihat misalnya apa pun yang cukup banyak pada wavelet oleh Donoho). Tidak seperti metode berbasis frekuensi murni, dukungan yang ringkas berarti mereka mampu menangani data yang tidak stasioner. Tidak seperti metode murni berbasis waktu, metode ini memungkinkan penyaringan berbasis frekuensi.
Dalam istilah praktis, untuk mendeteksi anomali atau mengubah titik, Anda akan menerapkan transformasi wavelet diskrit (mungkin varian yang dikenal sebagai "DWT Tumpang tindih Maksimum" atau "shift DWT invarian", tergantung pada siapa yang Anda baca) ke data, dan lihat pada set koefisien frekuensi yang lebih rendah untuk melihat apakah Anda memiliki perubahan signifikan dalam baseline. Ini akan menunjukkan kepada Anda ketika perubahan jangka panjang terjadi di bawah kebisingan sehari-hari. Percival dan Walden (lihat referensi di bawah) mendapatkan beberapa tes untuk koefisien signifikan secara statistik yang dapat Anda gunakan untuk melihat apakah perubahan seperti ini signifikan atau tidak.
Sebuah karya referensi yang sangat baik untuk wavelet diskrit adalah Percival dan Walden, "Metode Wavelet untuk Analisis Rangkaian Waktu". Karya pengantar yang baik adalah "Pengantar wavelet dan transformasi wavelet, primer" oleh Burrus, Gopinath, dan Guo. Jika Anda berasal dari latar belakang teknik, maka "Elemen wavelet untuk insinyur dan ilmuwan" adalah pengantar yang bagus dari sudut pandang pemrosesan sinyal.
(Diedit untuk memasukkan komentar Robin)
sumber