Dalam semua sistem rekomendasi modern yang telah saya lihat yang mengandalkan faktorisasi matriks, faktorisasi matriks non-negatif dilakukan pada matriks pengguna-film. Saya bisa mengerti mengapa non-negatif itu penting untuk interpretabilitas dan / atau jika Anda ingin faktor jarang. Tetapi jika Anda hanya peduli dengan kinerja prediksi, seperti dalam kompetisi hadiah Netflix misalnya, mengapa memaksakan pembatasan non-negatif? Tampaknya akan benar-benar lebih buruk daripada membiarkan nilai negatif juga dalam faktorisasi Anda.
Makalah ini adalah salah satu contoh yang sangat dikutip dari penggunaan faktorisasi matriks non-negatif dalam penyaringan kolaboratif.
Jawaban:
Saya bukan spesialis dalam sistem rekomendasi, tetapi sejauh yang saya mengerti, premis dari pertanyaan ini salah.
Non-negatif tidak begitu penting untuk penyaringan kolaboratif.
Hadiah Netflix dimenangkan pada tahun 2009 oleh tim BellKor. Berikut ini makalah yang menjelaskan algoritme mereka: The BellKor 2008 Solution to the Netflix Prize . Karena mudah dilihat, mereka menggunakan pendekatan berbasis SVD:
Lihat juga penulisan lebih populer ini oleh tim yang sama teknik Matriks faktorisasi untuk sistem merekomendasikan . Mereka berbicara banyak tentang SVD tetapi tidak menyebutkan NNMF sama sekali.
Lihat juga posting blog populer ini Pembaruan Netflix: Coba Ini di Rumah dari 2006, juga menjelaskan ide SVD.
Tentu saja Anda benar dan ada beberapa pekerjaan menggunakan NNMF untuk penyaringan kolaboratif juga. Jadi apa yang lebih baik, SVD atau NNMF? Saya tidak tahu, tapi inilah kesimpulan dari Studi Komparatif Algoritma Penyaringan Kolaboratif dari 2012:
sumber