Baru-baru ini saya membaca buku Skillicorn tentang dekomposisi matriks, dan sedikit kecewa, karena ditargetkan untuk audiens sarjana. Saya ingin mengkompilasi (untuk saya dan orang lain) bibliografi singkat dari makalah penting (survei, tetapi juga makalah terobosan) pada dekomposisi matriks. Apa yang ada dalam pikiran saya terutama adalah sesuatu pada SVD / PCA (dan varian kuat / jarang), dan NNMF, karena sejauh ini yang paling banyak digunakan. Apakah Anda semua memiliki rekomendasi / saran? Saya menahan milik saya untuk tidak bias jawaban. Saya akan meminta untuk membatasi setiap jawaban menjadi 2-3 makalah.
PS: Saya menyebut kedua dekomposisi ini sebagai yang paling banyak digunakan dalam analisis data . Tentu saja QR, Cholesky, LU dan polar sangat penting dalam analisis numerik. Tapi itu bukan fokus pertanyaan saya.
Untuk NNMF, Lee dan Seung menggambarkan algoritma berulang yang sangat sederhana untuk diimplementasikan. Sebenarnya mereka memberikan dua algoritma yang sama, satu untuk meminimalkan norma residu Frobenius, yang lain untuk meminimalkan Kullback-Leibler Divergence dari pendekatan dan matriks asli.
sumber
Mungkin, Anda dapat menemukan hal yang menarik
Dua tautan terakhir menunjukkan bagaimana faktorisasi matriks jarang digunakan dalam Pemfilteran Kolaboratif. Namun, saya percaya bahwa algoritma faktorisasi seperti SGD dapat berguna di tempat lain (setidaknya mereka sangat mudah dikodekan)
sumber
Witten, Tibshirani - Dekomposisi matriks yang dihukum
http://www.biostat.washington.edu/~dwitten/Papers/pmd.pdf
http://cran.r-project.org/web/packages/PMA/index.html
Martinsson, Rokhlin, Szlam, Tygert - SVD Acak
http://cims.nyu.edu/~tygert/software.html
http://cims.nyu.edu/~tygert/blanczos.pdf
sumber
Pada NIPS tahun ini ada sebuah makalah pendek tentang SVD terdistribusi dan berskala sangat besar yang bekerja dalam sekali jalan melalui matriks input streaming .
Makalah ini lebih berorientasi pada implementasi tetapi menempatkan segala sesuatunya ke dalam perspektif dengan waktu dan jam dinding yang sebenarnya. Tabel di dekat awal juga merupakan survei yang bagus.
sumber