Saya mencoba memahami model faktorisasi matriks untuk sistem yang merekomendasikan dan saya selalu membaca 'fitur laten', tetapi apa artinya itu? Saya tahu apa artinya fitur untuk dataset pelatihan tapi saya tidak bisa memahami ide fitur laten. Setiap makalah tentang topik yang saya temukan terlalu dangkal.
Edit:
jika Anda setidaknya bisa mengarahkan saya ke beberapa makalah yang menjelaskan gagasan itu.
machine-learning
data-mining
recommender-system
Jack Twain
sumber
sumber
Jawaban:
Laten berarti tidak dapat diamati secara langsung. Penggunaan umum istilah ini dalam PCA dan Factor Analysis adalah untuk mengurangi dimensi sejumlah besar fitur yang dapat diamati secara langsung menjadi seperangkat fitur yang dapat diamati secara tidak langsung.
sumber
Dalam konteks Metode Faktorisasi, fitur laten biasanya dimaksudkan untuk mengkarakterisasi item di sepanjang setiap dimensi. Biarkan saya jelaskan dengan contoh.
sumber
Saya akan mengatakan bahwa faktor lebih representatif daripada komponen utama untuk mendapatkan persepsi 'latensi' / ketersembunyian suatu variabel. Latensi adalah salah satu alasan mengapa para ilmuwan perilaku mengukur konstruksi persepsi seperti perasaan, kesedihan dalam hal banyak item / tindakan dan memperoleh angka untuk variabel tersembunyi tersebut yang tidak dapat diukur secara langsung.
sumber
Di sini data Anda adalah peringkat yang diberikan oleh berbagai pengguna ke berbagai film. Seperti yang telah ditunjukkan orang lain, laten berarti tidak dapat diamati secara langsung.
Untuk sebuah film, fitur latennya menentukan jumlah aksi, romansa, alur cerita, aktor terkenal, dll. Demikian pula, untuk dataset lain yang terdiri dari digit tulisan tangan, variabel latennya mungkin sudut, miring, miring, dll.
sumber