Apa langkah yang tepat untuk memproses ulang bentuk gelombang saya untuk melakukan analisis komponen independen (ICA) nanti? Saya mengerti caranya, meskipun penjelasan lebih lanjut tentang itu tidak ada salahnya, tapi saya lebih tertarik pada alasannya.
preprocessing
ica
jonsca
sumber
sumber
Jawaban:
Independen analisis komponen (ICA) digunakan untuk memisahkan linear campuran statistik independen dan yang paling penting, non-Gaussian † komponen ke konstituennya. Model standar untuk ICA bebas noise adalah
di mana adalah vektor pengamatan atau data, s adalah sumber sinyal / komponen asli (non-Gaussian) dan A adalah vektor transformasi yang mendefinisikan pencampuran linier dari sinyal konstituen. Biasanya, A dan s tidak diketahui.x s SEBUAH SEBUAH s
Pra-pemrosesan
Ada dua strategi pra-pemrosesan utama dalam ICA, yaitu pemusatan dan pemutihan / pengerasan. Alasan utama untuk pra-pemrosesan adalah:
Dari pengantar G. Li dan J. Zhang, "Sphering dan propertinya", The Indian Journal of Statistics, Vol. 60, Seri A, Bagian I, hlm. 119-133, 1998:
1. Pemusatan:
Pemusatan adalah operasi yang sangat sederhana dan hanya merujuk pada pengurangan rata-rata . Dalam praktiknya, Anda menggunakan mean sampel dan membuat vektor baru x c = x - ¯ x , di mana ¯ x adalah rata-rata data. Secara geometris, mengurangkan rata-rata setara dengan menerjemahkan pusat koordinat ke asal. Mean selalu dapat ditambahkan kembali ke hasil akhir (ini dimungkinkan karena perkalian matriks adalah distributif).E { x } xc= x - x¯¯¯ x¯¯¯
2. Pemutih:
Whitening adalah transformasi yang mengubah data sedemikian rupa sehingga memiliki kovarians matriks identitas, yaitu, . Biasanya, Anda bekerja dengan matriks kovarians sampel,E { xcxTc} = I
di mana hanyalah placeholder malas saya untuk faktor normalisasi yang sesuai (tergantung pada dimensi x ). Vektor putih baru dibuat sebagaiC x
yang akan memiliki kovarians dari . Secara geometris, pemutihan adalah transformasi penskalaan . Berikut adalah contoh kecil dalam Mathematica:saya
Plot pertama adalah densitas gabungan dari dua vektor acak yang terdistribusi seragam, atau komponen . Kedua menunjukkan efek mengalikan oleh vektor transformasi A . Alun-alun akan miring dan diskalakan menjadi belah ketupat. Dengan mengalikan dengan matriks pemutih, kerapatan sambungan kembali ke kotak yang sedikit diputar dari aslinya.s SEBUAH
Jika, setelah transformasi, ada nilai eigen mendekati nol, maka ini dapat dibuang dengan aman karena hanya noise dan hanya akan menghambat estimasi karena "pembelajaran berlebihan".
3. Pra-pemrosesan lainnya
Mungkin ada langkah-langkah pra-pemrosesan lain yang terlibat dalam aplikasi spesifik tertentu yang tidak mungkin dibahas dalam jawaban. Sebagai contoh, saya telah melihat beberapa artikel yang menggunakan log seri-waktu dan beberapa lainnya yang memfilter seri-waktu. Meskipun mungkin cocok untuk aplikasi / kondisi khusus mereka, hasilnya tidak terbawa ke semua bidang.
† Saya percaya dimungkinkan untuk menggunakan ICA jika paling banyak salah satu komponennya adalah Gaussian, meskipun saya tidak dapat menemukan referensi untuk ini sekarang.
Kenapa disebut "sphering"?
{-1,1}
NormalDistribution[]
Yang pertama adalah kepadatan bersama untuk dua Gauss yang tidak berkorelasi, yang kedua di bawah transformasi dan yang ketiga setelah pemutihan. Dalam praktiknya hanya langkah 2 dan 3 yang terlihat.
sumber