Objektif
Konfirmasikan apakah pemahaman tentang KKT benar atau tidak. Cari penjelasan dan konfirmasi lebih lanjut tentang KKT.
Latar Belakang
Mencoba memahami kondisi KKT, terutama yang saling melengkapi, yang selalu muncul tiba-tiba dalam artikel SVM. Saya tidak perlu daftar formula abstrak tetapi perlu penjelasan konkret, intuitif, dan grafis.
Pertanyaan
Jika P, yang meminimalkan fungsi biaya f (X), berada di dalam batasan (g (P)> = 0), itu adalah solusinya. Tampaknya KKT tidak relevan dalam kasus ini.
Tampaknya KKT mengatakan jika P tidak di dalam kendala, maka solusi X harus memuaskan di bawah ini dalam gambar. Apakah ini semua tentang KKT atau apakah saya kehilangan aspek penting lainnya?
Klarifikasi lainnya
- Haruskah f (x) cembung untuk diterapkan KKT?
- Haruskah g (x) linier untuk diterapkan pada KKT?
- Haruskah λ diperlukan dalam λ * g (X) = 0? Mengapa g (X) = 0 atau g (Xi) = 0 tidak cukup?
Referensi
- Kondisi Lagrange Multipler KKT
- Apakah setiap selokan di SVM memiliki pengali positif?
- http://fnorio.com/0136Lagrange_method_of_undetermined_multipliers/Lagrange_method_of_undetermined_multipliers.html
Perbarui 1
Terima kasih atas jawabannya tetapi masih berjuang untuk memahami. Fokus pada kebutuhan hanya di sini:
Apakah kondisi (2) dalam jawaban Matthew Gunn tentang titik tidak optimal (dalam lingkaran hijau) dan KKT tidak akan terpenuhi di sana? Dan intinya akan diidentifikasi dengan melihat Hessian seperti dalam jawaban Mark L. Stone?
Saya kira situasi lain adalah poin sadel, tetapi hal yang sama berlaku?
Jawaban:
Gagasan dasar dari kondisi KKT sebagai kondisi yang diperlukan untuk optimum adalah bahwa jika mereka tidak bertahan pada titik yang layak , maka ada arah δ yang akan meningkatkan tujuan f tanpa meningkatkan (dan karenanya mungkin melanggar) kendala. (Jika kondisi KKT tidak berlaku di x maka xx δ f x x tidak bisa menjadi optimal, maka kondisi KKT diperlukan untuk suatu titik menjadi optimal.)
Bayangkan Anda memiliki masalah pengoptimalan:
Di mana dan ada kendala k .x∈Rn k
Kondisi KKT dan Farkas Lemma
Misalkan menjadi vektor kolom yang menunjukkan gradien f yang dievaluasi pada x .∇f(x) f x
Diterapkan pada situasi ini, Farkas Lemma menyatakan bahwa untuk setiap titik tepat satux∈Rn pernyataan berikut berlaku:
Apa artinya ini? Ini berarti bahwa untuk setiap titik layak , baik:x
Kondisi (1) menyatakan bahwa ada pengganda non-negatif sehingga kondisi KKT terpenuhi pada titik x . (Secara geometris, dikatakan bahwa - ∇ fλ x −∇f terletak pada kerucut cembung didefinisikan oleh gradien dari kendala.)
Kondisi (2) menyatakan bahwa pada titik , ada arah δx δ untuk bergerak (lokal) sehingga:
(Secara geometris, arah yang layak mendefinisikan hyperplane pemisah antara vektor - ∇ f ( x ) dan kerucut cembung yang ditentukan oleh vektor ∇ g j ( x )δ −∇f(x) ∇gj(x) .)
(Catatan: untuk memetakan ini ke Farkas Lemma , tentukan matriks )A=[∇g1,∇g2,…,∇gk]
Argumen ini memberi Anda perlunya (tetapi tidak mencukupi) kondisi KKT secara optimal. Jika kondisi KKT tidak terpenuhi (dan kualifikasi kendala terpenuhi), dimungkinkan untuk meningkatkan tujuan tanpa melanggar kendala.
Peran kualifikasi kendala
Apa yang salah? Anda bisa mendapatkan situasi yang merosot di mana gradien dari kendala tidak secara akurat menggambarkan arah yang memungkinkan untuk bergerak.
Ada banyak kualifikasi kendala yang berbeda untuk dipilih yang akan memungkinkan argumen di atas bekerja.
Penafsiran min, maks. (Yang paling intuitif)
Bentuk Lagrangian
Alih-alih meminimalkan tunduk pada batasan g j , bayangkan bahwa Anda sedang berusaha untuk meminimalkan L sementara beberapa lawan sedang mencoba untuk memaksimalkan itu. Anda dapat mengartikan pengganda λ if gj L λi sebagai penalti (dipilih oleh beberapa lawan) karena melanggar kendala.
Solusi untuk masalah pengoptimalan asli setara dengan:
Itu adalah:
Misalnya, jika Anda melanggar batasan , saya dapat menghukum Anda dengan mengatur λ 2g2 λ2 hingga tak terbatas!
Dualitas yang lemah
Untuk fungsi apa pun perhatikan bahwa:f(x,y)
Sejak itu berlaku untuk setiap x dan y juga menyatakan bahwa: max y min x f ( x , y ) ≤ min x max y f ( x , y )x^ y^
Dalam pengaturan Langrian, ini menghasilkan bahwamaxλminxL(x,λ)≤minxmaxλL(x,λ) dikenal sebagai dualitas yang lemah.
Masalah gandamaxλminxL(x,λ) memberi Anda batas yang lebih rendah pada solusi
Dualitas yang kuat
Di bawah kondisi khusus tertentu (mis. Masalah cembung di mana kondisi Slater berlaku), Anda memiliki dualitas yang kuat (yaitu properti saddle point).
Hasil yang indah ini menyiratkan bahwa Anda dapat membalik urutan masalah.
sumber
f (x) menjadi cembung diperlukan agar KKT mencukupi untuk x minimum lokal. Jika f (x) atau -g (x) tidak cembung, x pemenuhan KKT dapat berupa minimum lokal, saddlepoint, atau maksimum lokal.
g (x) menjadi linier, bersama dengan f (x) dapat dibedakan secara kontinu sudah cukup untuk kondisi KKT diperlukan untuk minimum lokal. g (x) menjadi linier berarti bahwa kualifikasi kendala Linearitas untuk KKT yang diperlukan untuk minimum lokal terpenuhi. Namun, ada kualifikasi kendala lain yang kurang membatasi yang cukup untuk kondisi KKT diperlukan untuk minimum lokal. Lihat bagian Kondisi keteraturan (atau kualifikasi kendala) di https://en.wikipedia.org/wiki/Karush%E2%80%93Kuhn%E2%80%93Tucker_conditions .
Jika minimum lokal tidak memiliki kendala "aktif" (jadi dalam kasus hanya kendala ketimpangan, kendala itu tidak puas dengan kesetaraan), pengganda Lagrange terkait dengan kendala tersebut harus nol, dalam hal ini, KKT mengurangi ke kondisi yang gradien objektif = 0. Dalam kasus seperti itu, ada nol "biaya" untuk nilai objektif optimal dari pengetatan epsilon dari kendala.
Info lebih lanjut :
Fungsi dan kendala obyektif adalah cembung dan dapat dibedakan secara terus-menerus menyiratkan KKT cukup untuk minimum global.
Jika fungsi dan kendala obyektif secara terus-menerus dibedakan dan kendala memenuhi kualifikasi kendala, KKT diperlukan untuk minimum lokal.
Jika fungsi dan kendala obyektif dibedakan secara terus-menerus, cembung, dan kendala memenuhi kualifikasi kendala, KKT diperlukan dan cukup untuk minimum global.
sumber