Saya mempelajari pembelajaran mesin dari kuliah Andrew Ng Stanford dan baru saja menemukan teori dimensi VC. Menurut ceramah dan apa yang saya mengerti, definisi dimensi VC dapat diberikan sebagai,
Jika Anda dapat menemukan satu set poin, sehingga dapat dihancurkan oleh classifier (yaitu mengklasifikasikan semua kemungkinan label dengan benar) dan Anda tidak dapat menemukan set poin yang dapat dihancurkan (yaitu untuk setiap set poin setidaknya ada satu urutan pelabelan sehingga classifier tidak dapat memisahkan semua poin dengan benar), maka dimensi VC adalah .
Profesor juga mengambil contoh dan menjelaskan ini dengan baik. Yang mana:
Membiarkan,
Kemudian 3 poin dapat dikelompokkan berdasarkan benar dengan memisahkan bidang hyper seperti yang ditunjukkan pada gambar berikut.
Dan itulah mengapa dimensi VC adalah 3. Karena untuk setiap 4 poin dalam bidang 2D, classifier linier tidak dapat menghancurkan semua kombinasi poin. Sebagai contoh,
Untuk set poin ini, tidak ada hyper plane yang dapat ditarik untuk mengklasifikasikan set ini. Jadi dimensi VC adalah 3.
Saya mendapat ide sampai di sini. Tetapi bagaimana jika kita mengikuti jenis pola?
Atau pola di mana tiga titik bertepatan satu sama lain, Di sini juga kita tidak bisa menggambar bidang hiper memisahkan antara 3 titik. Tapi tetap saja pola ini tidak dipertimbangkan dalam definisi dimensi VC. Mengapa? Hal yang sama juga dibahas dalam ceramah yang saya tonton di sini pada pukul 16:24 tetapi profesor tidak menyebutkan alasan pasti di balik ini.
Contoh penjelasan intuitif apa pun akan dihargai. Terima kasih
sumber
Jawaban:
Definisi dimensi VC adalah: jika ada satu set n poin yang dapat dihancurkan oleh classifier dan tidak ada set n + 1 poin yang dapat dihancurkan oleh classifier, maka dimensi VC dari classifier adalah n.
Definisi ini tidak mengatakan: jika set n poin dapat dihancurkan oleh classifier ...
Jika dimensi VC classifier adalah 3, itu tidak harus menghancurkan semua kemungkinan pengaturan 3 poin.
Jika dari semua pengaturan 3 poin Anda dapat menemukan setidaknya satu pengaturan seperti itu yang dapat dihancurkan oleh classifier, dan tidak dapat menemukan 4 poin yang dapat dihancurkan, maka dimensi VC adalah 3.
sumber