Saya menggunakan SVM untuk klasifikasi dan saya mencoba menentukan parameter optimal untuk kernel linear dan RBF. Untuk kernel linear saya menggunakan pemilihan parameter yang divalidasi silang untuk menentukan C dan untuk kernel RBF saya menggunakan pencarian grid untuk menentukan C dan gamma.
Saya memiliki 20 fitur (angka) dan 70 contoh pelatihan yang harus diklasifikasikan ke dalam 7 kelas.
Rentang pencarian mana yang harus saya gunakan untuk menentukan nilai optimal untuk parameter C dan gamma?
sumber
Lihat bagian 2.3.2 dari makalah ini oleh Chapelle dan Zien. Mereka memiliki heuristik yang bagus untuk memilih rentang pencarian yang baik untuk dari kernel RBF dan C untuk SVM. Saya mengutipσ C
Setelah itu, mereka menggunakan kelipatan (misalnya untuk k ∈ { - 2 , . . . , 2 } ) dari nilai default sebagai rentang pencarian dalam kotak-pencarian menggunakan cross-validasi. Itu selalu berhasil dengan baik bagi saya.2k k∈{−2,...,2}
Tentu saja, kami @ciri berkata, menormalkan data dll selalu merupakan ide yang baik.
sumber