Singkatnya, secara grafis

13

Objektif

Konfirmasikan apakah pemahaman tentang KKT benar atau tidak. Cari penjelasan dan konfirmasi lebih lanjut tentang KKT.

Latar Belakang

Mencoba memahami kondisi KKT, terutama yang saling melengkapi, yang selalu muncul tiba-tiba dalam artikel SVM. Saya tidak perlu daftar formula abstrak tetapi perlu penjelasan konkret, intuitif, dan grafis.

Pertanyaan

Jika P, yang meminimalkan fungsi biaya f (X), berada di dalam batasan (g (P)> = 0), itu adalah solusinya. Tampaknya KKT tidak relevan dalam kasus ini.

enter image description here

Tampaknya KKT mengatakan jika P tidak di dalam kendala, maka solusi X harus memuaskan di bawah ini dalam gambar. Apakah ini semua tentang KKT atau apakah saya kehilangan aspek penting lainnya?

enter image description here

Klarifikasi lainnya

  1. Haruskah f (x) cembung untuk diterapkan KKT?
  2. Haruskah g (x) linier untuk diterapkan pada KKT?
  3. Haruskah λ diperlukan dalam λ * g (X) = 0? Mengapa g (X) = 0 atau g (Xi) = 0 tidak cukup?

Referensi


Perbarui 1

Terima kasih atas jawabannya tetapi masih berjuang untuk memahami. Fokus pada kebutuhan hanya di sini:

Apakah kondisi (2) dalam jawaban Matthew Gunn tentang titik tidak optimal (dalam lingkaran hijau) dan KKT tidak akan terpenuhi di sana? Dan intinya akan diidentifikasi dengan melihat Hessian seperti dalam jawaban Mark L. Stone?

Saya kira situasi lain adalah poin sadel, tetapi hal yang sama berlaku?

enter image description here

enter image description here pengguna23658

mon
sumber
1
Pertanyaan ini dapat mengumpulkan lebih banyak perhatian di situs matematika; Kondisi KKT belum tentu "statistik". Ahli statistik meminjam ini dan hasil lainnya dari analisis numerik untuk menyelesaikan masalah statistik yang menarik, tetapi ini lebih merupakan pertanyaan matematika.
user23658
1
(1) Jika kendala tidak mengikat, masalah optimasi dengan kendala memiliki solusi yang sama dengan masalah optimasi tanpa kendala. (2) Baik perlu cembung maupun g tidak perlu linier agar kondisi KKT diperlukan secara optimal. (3) Anda memang membutuhkan kondisi khusus (mis. Masalah cembung di mana kondisi Slater berlaku) agar kondisi KKT cukup untuk kondisi optimal. fg
Matthew Gunn
2
Gagasan dasar dari kondisi kelonggaran komplementer (yaitu mana g ( x ) 0 adalah kendala) adalah bahwa jika kendala kendur (yaitu g ( x ) < 0 ) pada x optimal , maka penalti λ untuk mengencangkan kendala adalah 0. Dan jika ada penalti positif λ untuk mengencangkan kendala, maka kendala harus mengikat (yaitu g ( x ) = 0λg(x)=0g(x)0g(x)<0xλλg(x)=0). Jika lalu lintas berjalan lancar, jembatan tol untuk mobil lain adalah nol. Dan jika jembatan tol λ > 0 , maka jembatan harus pada batas kapasitas. λλ>0
Matthew Gunn
1
Teorema KKT dasar mengatakan bahwa jika kondisi KKT tidak terpenuhi pada titik , maka titik x tidak optimal. Kondisi KKT diperlukan untuk optimal tetapi tidak mencukupi. (Misalnya, jika fungsi memiliki titik sadel, minimum lokal dll ... kondisi KKT mungkin terpenuhi tetapi titik tersebut tidak optimal!) Untuk kelas masalah tertentu (mis. Masalah cembung di mana kondisi Slater berlaku), KKT kondisi menjadi kondisi yang cukup . xx
Matthew Gunn

Jawaban:

8

Gagasan dasar dari kondisi KKT sebagai kondisi yang diperlukan untuk optimum adalah bahwa jika mereka tidak bertahan pada titik yang layak , maka ada arah δ yang akan meningkatkan tujuan f tanpa meningkatkan (dan karenanya mungkin melanggar) kendala. (Jika kondisi KKT tidak berlaku di x maka xxδfxx tidak bisa menjadi optimal, maka kondisi KKT diperlukan untuk suatu titik menjadi optimal.)

Bayangkan Anda memiliki masalah pengoptimalan:

minimize (over x)f(x)subject toj{1k}gj(x)0

Di mana dan ada kendala k .xRnk

Kondisi KKT dan Farkas Lemma

Misalkan menjadi vektor kolom yang menunjukkan gradien f yang dievaluasi pada x .f(x)fx

Diterapkan pada situasi ini, Farkas Lemma menyatakan bahwa untuk setiap titik tepat satuxRn pernyataan berikut berlaku:

  1. Ada ada sehingga Σ k j = 1 λ jg j ( x ) = - f ( x ) dan λ 0λRkj=1kλjgj(x)=f(x)λ0
  2. Ada sedemikian rupa sehingga j δ g j ( x ) 0 dan δ f ( x ) < 0δRnjδgj(x)0δf(x)<0

Apa artinya ini? Ini berarti bahwa untuk setiap titik layak , baik:x

  • Kondisi (1) tahan dan kondisi KKT terpenuhi.
  • Kondisi (2) bertahan dan ada arah yang layak yang meningkatkan fungsi tujuan f tanpa meningkatkan kendala g j . (mis. Anda dapat meningkatkan f dengan berpindah dari x ke x + ϵ δδfgjfxx+ϵδ )

Kondisi (1) menyatakan bahwa ada pengganda non-negatif sehingga kondisi KKT terpenuhi pada titik x . (Secara geometris, dikatakan bahwa - fλxf terletak pada kerucut cembung didefinisikan oleh gradien dari kendala.)

Kondisi (2) menyatakan bahwa pada titik , ada arah δxδ untuk bergerak (lokal) sehingga:

  • Bergerak ke arah mengurangi fungsi objektif (karena produk titik f ( x ) dan δδf(x)δ kurang dari nol).
  • Bergerak ke arah tidak meningkatkan nilai kendala (karena produk titik g j ( x ) dan δ kurang dari atau sama dengan nol untuk semua kendala j ).δgj(x)δj

(Secara geometris, arah yang layak mendefinisikan hyperplane pemisah antara vektor - f ( x ) dan kerucut cembung yang ditentukan oleh vektor g j ( x )δf(x)gj(x) .)

(Catatan: untuk memetakan ini ke Farkas Lemma , tentukan matriks )A=[g1,g2,,gk]

Argumen ini memberi Anda perlunya (tetapi tidak mencukupi) kondisi KKT secara optimal. Jika kondisi KKT tidak terpenuhi (dan kualifikasi kendala terpenuhi), dimungkinkan untuk meningkatkan tujuan tanpa melanggar kendala.

Peran kualifikasi kendala

Apa yang salah? Anda bisa mendapatkan situasi yang merosot di mana gradien dari kendala tidak secara akurat menggambarkan arah yang memungkinkan untuk bergerak.

Ada banyak kualifikasi kendala yang berbeda untuk dipilih yang akan memungkinkan argumen di atas bekerja.

Penafsiran min, maks. (Yang paling intuitif)

Bentuk Lagrangian

L(x,λ)=f(x)+j=1kλjgj(x)

Alih-alih meminimalkan tunduk pada batasan g j , bayangkan bahwa Anda sedang berusaha untuk meminimalkan L sementara beberapa lawan sedang mencoba untuk memaksimalkan itu. Anda dapat mengartikan pengganda λ ifgjLλi sebagai penalti (dipilih oleh beberapa lawan) karena melanggar kendala.

Solusi untuk masalah pengoptimalan asli setara dengan:

minxmaxλL(x,λ)

Itu adalah:

  1. Anda pertama-tama memilih untuk meminimalkan Lagrangian L , menyadari bahwa ...xL
  2. Saya kemudian akan memilih untuk memaksimalkan Lagrangian (setelah mengamati pilihan Anda x ).λx

Misalnya, jika Anda melanggar batasan , saya dapat menghukum Anda dengan mengatur λ 2g2λ2 hingga tak terbatas!

Dualitas yang lemah

Untuk fungsi apa pun perhatikan bahwa:f(x,y)

x^,y^minxf(x,y^)f(x^,y^)maxyf(x^,y)

Sejak itu berlaku untuk setiap x dan y juga menyatakan bahwa: max y min x f ( x , y ) min x max y f ( x , y )x^y^

maxyminxf(x,y)minxmaxyf(x,y)

Dalam pengaturan Langrian, ini menghasilkan bahwa maxλminxL(x,λ)minxmaxλL(x,λ) dikenal sebagai dualitas yang lemah.

Masalah ganda maxλminxL(x,λ) memberi Anda batas yang lebih rendah pada solusi

Dualitas yang kuat

Di bawah kondisi khusus tertentu (mis. Masalah cembung di mana kondisi Slater berlaku), Anda memiliki dualitas yang kuat (yaitu properti saddle point).

maxλminxL(x,λ)=minxmaxλL(x,λ)

Hasil yang indah ini menyiratkan bahwa Anda dapat membalik urutan masalah.

  1. λ

  2. xL

λ

Matthew Gunn
sumber
Hargai informasi dan tautan untuk mengisi kesenjangan pemahaman. Izinkan saya untuk mengonfirmasi. Kondisi (1) berarti bahwa KKT mengatakan bahwa titik X menjadi solusi, ia harus memenuhi λ * g (X) = 0, λ> = 0, dan panjang gradien g (X) adalah λ kali dari bahwa dari f (X), kalau tidak kita akan menemukan gradien dari arah titik f (X) di mana lebih kecil f (X ') dapat ditemukan?
Senin
3
Kondisi slater (hanya) kualifikasi kendala yang dapat diterapkan untuk masalah optimasi cembung, yaitu membuat KKT diperlukan. Cembung membuat KKT mencukupi. Jadi, kondisi Slater untuk masalah optimisasi cembung di mana fungsi objektif dan batasannya cembung dan terus-menerus dibedakan membuat KKT diperlukan dan cukup untuk minimum global. Kondisi slater adalah bahwa setidaknya ada satu titik layak (yaitu, memenuhi semua kendala) yang ada di interior ketat semua kendala nonlinier (apa pun yang berjalan dengan kendala linier, selama layak).
Mark L. Stone
5

f (x) menjadi cembung diperlukan agar KKT mencukupi untuk x minimum lokal. Jika f (x) atau -g (x) tidak cembung, x pemenuhan KKT dapat berupa minimum lokal, saddlepoint, atau maksimum lokal.

g (x) menjadi linier, bersama dengan f (x) dapat dibedakan secara kontinu sudah cukup untuk kondisi KKT diperlukan untuk minimum lokal. g (x) menjadi linier berarti bahwa kualifikasi kendala Linearitas untuk KKT yang diperlukan untuk minimum lokal terpenuhi. Namun, ada kualifikasi kendala lain yang kurang membatasi yang cukup untuk kondisi KKT diperlukan untuk minimum lokal. Lihat bagian Kondisi keteraturan (atau kualifikasi kendala) di https://en.wikipedia.org/wiki/Karush%E2%80%93Kuhn%E2%80%93Tucker_conditions .

Jika minimum lokal tidak memiliki kendala "aktif" (jadi dalam kasus hanya kendala ketimpangan, kendala itu tidak puas dengan kesetaraan), pengganda Lagrange terkait dengan kendala tersebut harus nol, dalam hal ini, KKT mengurangi ke kondisi yang gradien objektif = 0. Dalam kasus seperti itu, ada nol "biaya" untuk nilai objektif optimal dari pengetatan epsilon dari kendala.

Info lebih lanjut :

Fungsi dan kendala obyektif adalah cembung dan dapat dibedakan secara terus-menerus menyiratkan KKT cukup untuk minimum global.

Jika fungsi dan kendala obyektif secara terus-menerus dibedakan dan kendala memenuhi kualifikasi kendala, KKT diperlukan untuk minimum lokal.

Jika fungsi dan kendala obyektif dibedakan secara terus-menerus, cembung, dan kendala memenuhi kualifikasi kendala, KKT diperlukan dan cukup untuk minimum global.

ZZTHZHZ

Mark L. Stone
sumber