Dalam laporan teknis tentang Galahad [1], penulis menyatakan, dalam konteks masalah pemrograman nonlinier umum,
Menurut pendapat kami, tidak pernah ada banyak keraguan bahwa metode SQP [sequential quadratic programming] akan lebih berhasil [daripada metode Augmented Lagrangian] dalam jangka panjang ...
Apa yang bisa menjadi dasar dari kepercayaan itu? Yaitu, apakah ada hasil teoritis yang menyarankan metode SQP harus lebih cepat / lebih dapat diandalkan daripada metode Augmented Lagrangian?
[1] Galahad, perpustakaan paket Fortran 90 yang aman untuk pengoptimalan nonlinear skala besar, oleh Gould, Orban, dan Toint
sumber
Dalam hal iterasi luar, SQP harus menang karena mencakup informasi turunan kedua, sedangkan metode lagrangian yang diperluas seperti ADMM tidak.
Namun, satu hal yang perlu diingat adalah bahwa setiap iterasi untuk metode ini melibatkan penyelesaian sistem linier, jadi untuk melakukan perbandingan yang adil Anda harus memperhitungkan betapa mudahnya sistem ini menyelesaikannya.
Untuk metode SQP Anda memecahkan sesuatu seperti mana adalah Hessian (atau perkiraannya) yang biasanya hanya tersedia secara implisit dalam hal tindakannya pada vektor, dan adalah gradien. Hessian mengandung tidak hanya , tetapi juga kombinasi dari matriks dan invers matriks lainnya yang berasal dari linierisasi kendala dan regularisasi.H g A
Mengkondisikan Hessians adalah bisnis yang cukup rumit dan jauh lebih sedikit dipelajari daripada mengkondisikan masalah ke depan. Metode standar adalah untuk memperkirakan invers Hessian dengan L-BFGS, tetapi ini efektivitas terbatas ketika invers Hessian adalah peringkat tinggi. Metode populer lainnya adalah dengan memperkirakan Hessian sebagai jumlah dari matriks peringkat-rendah plus matriks yang mudah untuk dibalik, tetapi ini juga memiliki efektivitas yang terbatas untuk masalah-masalah sulit. Teknik estimasi Hessian populer lainnya didasarkan pada pendekatan jarang, tetapi masalah kontinum sering memiliki Hessian yang memiliki pendekatan jarang.
sumber