Saya ingin mengubah data saya sehingga varians akan menjadi satu dan kovariansi akan menjadi nol (yaitu saya ingin memutihkan datanya). Lebih jauh lagi, berarti harus nol.
Saya tahu saya akan sampai di sana dengan melakukan standardisasi-Z dan transformasi PCA, tetapi dalam urutan apa saya harus melakukannya?
Saya harus menambahkan bahwa transformasi whitening yang dibuat harus memiliki bentuk .
Apakah ada metode yang mirip dengan PCA yang melakukan kedua transformasi ini dan memberi saya rumus dari formulir di atas?
pca
linear-algebra
Angelorf
sumber
sumber
Jawaban:
Pertama, Anda mendapatkan nol rata-rata dengan mengurangi rata-rataμ = 1N∑ x .
Kedua, Anda mendapatkan kovarian nol dengan melakukan PCA. Jika adalah matriks kovarian data Anda, maka PCA sama dengan melakukan eigendekomposisi boldsymbol , di mana adalah matriks rotasi ortogonal yang terdiri dari vektor eigen dari , dan adalah matriks diagonal dengan nilai eigen di diagonal. Matrix memberikan rotasi yang diperlukan untuk mende-korelasikan data (yaitu memetakan fitur asli ke komponen utama).Σ Σ = U Λ U⊤ U Σ Λ U⊤
Ketiga, setelah rotasi masing-masing komponen akan memiliki varian yang diberikan oleh nilai eigen yang sesuai. Jadi untuk membuat varians sama dengan , Anda harus membaginya dengan akar kuadrat dari .1 Λ
Secara keseluruhan, transformasi pemutihan adalah . Anda dapat membuka tanda kurung untuk mendapatkan formulir yang Anda cari.x ↦ Λ- 1 / 2U⊤( x - μ )
Memperbarui. Lihat juga utas ini nanti untuk detail lebih lanjut: Apa perbedaan antara ZCA whitening dan PCA whitening?
sumber